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内 剧 内 

本 书 是 统计 学 的 人 门 书 。 

我 将 读者 对 象 预 设 为 下 列 两 大 类 

O 写作 毕业 论文 或 在 工作 中 须 进行 资料 分 析 者 

© 虽然 现在 没有 分 析 资料 的 需求 ， 但 想 一 罕 统 计 学 的 奥妙 者 。 当 然 也 非常 欢迎 对 
统计 学 稍 有 涉猎 的 读者 。 

统计 学 是 与 “生活 ”及 “工作 ”有 密切 关系 的 一 门 学 科 。 如 果 能 够 掌握 统计 学 知识 ， 
那么 你 的 生活 将 会 变 得 更 加 方便 ， 例 如 : 

© 可 预测 校庆 时 推出 的 炒面 可 卖 出 几 份 

© 可 预测 资格 考试 可 否 通过 

@ 可 比较 投入 药剂 X 和 不 投药 剂 X 两 种 情况 下 的 存活 率 


本 书 共 分 7 章 。 各 章 原则 上 由 下 列 部 分 构成 。 
© 漫画 部 分 

O 补充 漫画 部 分 的 解说 

© 例题 和 解答 

o 总 整理 

但 是 也 有 某 些 章节 并 不 遵循 上 述 构成 方式 。 


读者 即使 仅 阅读 漫画 部 分 ， 也 可 逐渐 了 解 统计 学 概念 。 如 果 再 阅读 其 他 部 分 ， 则 
可 增加 知识 掌握 的 深度 。 

“统计 学 可 真是 有 趣 而 实用 呀 ! ” 若 各 位 在 读 完 本 书后 能 有 这 样 的 感受 ， 我 将 感到 
荣幸 之 至 。 


感谢 欧姆 社 的 各 位 编辑 ， 能 给 我 这 次 机 会 著作 此 书 。 同 时 也 感 TREND-PRO 股份 

有 限 公司 的 各 位 漫画 作者 ， 有 了 他 们 的 努力 ， 我 的 原著 才 得 以 转换 成 漫画 形式 。 另 外 ， 

还 有 负责 脚本 创作 的 re-akino, 负责 做 画 的 Inoue Iroha。 此 外 ， 还 要 感谢 在 我 著作 之 际 
为 我 提供 多 方 建议 的 日 本 立 教 大 学 社会 学 系 的 酒 折 文 武 老师 。 

高 桥 信 
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我 回来 了 ! 





























不 好 意思 ， 打 扰 了 。 

















这 是 我 们 的 公司 的 月 可 | gm £7] 
Ath, BARNA LATS y 
MASTUR, Att KAD 


他 来 家 里 坐 坐 。 























您 好 ! 
打扰 了 1! 


















































A ee 


sf pal 









CJ 

'( 

UY) 
oF 

















































































































Ye 
VE 
KAT! & 
S 


mgs 













































































































































































































































































2 RR 令 人 怪 动 的 统计 学 






我 回来 了 ， 琉 衣 ， 这 
是 我 们 公司 的 同事 ， 
ET ihe 




















那么 ， 五 十 鸯 先生 ， 
您 在 哪 一 个 部 门 工作 
"2 


4 


具体 来 说 ， 就 是 利用 统计 学 
知识 来 做 市 场 调查 …… 


你 还 在 上 高 中 ， 即 便 我 这 么 
说 ， 我 起 你 应 该 还 是 不 知道 
什么 是 “营销 "， 对 吧 ! 


真是 好 直接 啊 
那么 "统计 学 " 呢 ? 





好 像 有 点 太 难 了 | 













































































序章 ” 令 人 性 动 的 统计 学 





















S| HARE. 





大 概 不 是 很 清楚 吧 ? 所 谓 的 
RHF, MEK, MAK 
样本 反应 出 的 信息 中 推测 总 
体 状况 的 学 问 。 
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po fe 





正好 今天 的 晚报 有 
ABRAMS HR H 
ASB! 





0) 
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萌 每 晚报 并 没有 来 询问 我 































































































































































“根据 朝 每 晚报 的 调查 结果 ， 这 是 怎么 算出 来 
GLES S E ELA 的 呢 ? 


是 的 ， 此 处 就 应 用 了 琉 衣 ， 日 本 大 约 有 多 


a! 统计 学 知识 哟 1 1? 
明明 你 们 者 没有 直接 接受 tt 


调查 ， 但 朝 每 晚报 却 还 能 
JE PS RRP 


而 且 你 们 也 都 有 投票 权 呀 ! 
是 不 是 有 点 奇怪 啊 ? 了 





没 错 。 因 此 ， 我 们 若 对 所 有 
具备 投票 权 的 人 进行 调查 并 
算出 支持 率 ， 那 么 ， 这 个 结 
果 肯 定 非常 准确 ， 这 不 会 有 




















不 过 ， 和 要 对 数量 如 此 应 大 
的 人 群 进行 调查 那 难度 可 












EN 到 
所 以 才 会 限定 人 数 © M 
来 进行 调查 。 

> 

ame an, LXV 






































琉 衣 ， 统 计 学 上 ， 将 应 做 为 真正 调查 对 象 的 
集合 称 为 “总 体 '”， 而 由 总 体 中 取出 的 部 分 


个 体 所 组 成 的 集合 则 称 为 “样本 2”。 


1. 总 体 : Population。 
6 序章，” 令 人 性 动 的 统计 学 


2. 样本 : Samples 



































CELT BHR EH 
ROKR RRE | 























































总 之 ， 以 内 阔 支 持 率 为 例 ， 总 体 即 为 
“所 有 具有 投票 权 的 人 "。 





而 这 个 调查 似乎 是 以 2000 人 为 询问 
对 象 ， 因 此 ， 这 2000 人 即 为 样本 。 













然而 ， 这 在 现实 中 是 不 可 
能 的 。 真 是 令 人 困 考 呀 | 






就 算 无 法 进行 精细 的 
调查 ， 难 道 没 办 法 尽 
可 能 准确 地 得 知 总 体 


















那么 ， 解 决 这 个 问 
题 的 最 佳 方法 就 是 





+A! 
再 多 教 我 一 些 吧 1! 


























果然 很 帅 啊 ! 










































多 去 了 五 十 
R, BBS 

















这 个 计划 简直 
太 完美 了 19 
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因为 我 开始 对 各 区 的 
工作 产生 兴趣 了 。 
































Co EN 












































































































一 位 统计 学 的 家 庭 
#0 






4! 
艺苑 的 同事 也 可 以 
*! 

Pode BT HRA 




















kid 
琉 衣 ， 这 是 我 的 同 A A 
山本 守 。 | 
| - 


¥ 
到 


y 22 

Q 。 山本 住 得 比 五 十 
RH ARE | 
而 且 救 得 也 比较 
aA! 












































































































































我 就 吻 着 这 家 伙 
五 十 鸯 先生 吧 1! 
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确认 数据 种 类 

















eeeeeey 
































81. 分 类 数据 和 数值 数据 疼 | 


那么 





山本 老师 ， 我 们 
从 什么 地 方 开始 


学 起 呢 ? 





RURTHRR | A 
(AN 

















i) 


® 
Koy 
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其 实 我 也 挺 喜欢 









大 哈密 瓜 学 园 物语 第 五 集 
爱 读者 问卷 





5. 非 常 无 种 
Qz. 你 的 性 别 是 7 
1. 女 2% 





Q3 .你 的 年 龄 是 7 
Q4. 平 均 每 月 购买 几 本 杂志 了 


感 放 您 的 协助 。 您 的 宝贵 意见 ， 阁 是 我 们 今后 
出 版 和 策划 的 重要 参考 。 





(如 果 中 奖 ) TUBA AM 5 
(KEM) HARM | 
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MIRE RR RB 





Qa 

i 平均 一 个 月 购 

买 的 条 志 数 
(m) 





琉 衣 
A 
B 
C 
D 
E 
É 
G 
H 
I 


4 wd 4 ta 4 we ae 4 4 
Wo N= WHEN WH = N 

















假设 问卷 调查 的 结果 








女 哈 密 瓜 学 园 物 语 第 五 集 妇 


以 这 份 问卷 来 说 ， 


就 是 这 种 情况 。 A È 者 日 郑 


ORE CR OLGE BERMAN? | 
FRAR $ 


2. 有 点 有 到 
不 可 测量 的 数据 
5. BR 

02, 你 的 性 别 是 3 


1. 女 


03. 你 的 年 龄 为 了 174 


可 测量 的 数据 。 


04. 平 均 每 月 购 入 几 本 杂志 最 3 _2 术 


个 谢 您 的 协助 。 您 的 宝贵 意见 ， 将 作为 我 们 今后 
出 版 和 策划 的 全 要 BB, 





不 可 测量 的 数据 称 为 “分 类 数据 7”， 


而 可 测量 的 数据 称 为 “数值 数据 2”- 





1. 分 类 数据 Category Data 或 Categorical Data. 2. 数值 数据 : Numerical Datas 


rar 


光 2. 分 类 





BITRE, “Ole ee |) 
的 感觉 "是 "不 可 测量 "的 数 
据 。 


因为 它 的 数值 数 
据 之 间 并 非 相 等 
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TA] 


Wy 4 
N 你 体重 多 少 ? 
~ DZ 
T [E 













A: 













由 于 这 个 尺子 以 1 厘米 为 测量 刻 
度 ， 因 此 ，151 厘 米 的 上 一 个 刘 
度 就 是 152 厘 米 ， 再 往 上 也 是 等 
AMIS BA, 4B Ro 


BARR fo AaB th IR Mi] 5 
间隔 都 是 相等 的 。 


























































































































那么 英 检 的 级 数 是 算 
哪 一 类 数据 呢 了 


英 检 难 易 度 的 基准 
a | æ 





2 级 





大 学 


高 中 中 学 | ”中 学 
高 级 程度 “| ywer | 毕业 程度 | ”中 级 程度 | ”初级 程度 


单词 量 








10 000 约 的 3 的 
的 5, 100 单 词 量 2, 100 单 词 量 1, 300 单 词 量 600 单 词 量 





【摘自 财团 法 人 日 本 英语 考试 协会 http://www.eilken.orjp ) 


依 级 别 不 同 ， 所 应 掌握 的 
具体 的 单词 量 差 很 多 呢 | 


除了 单词 量 ， 其 他 部 分 的 
难 易 程度 也 有 差异 呢 | 
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| | | 美玲 的 等 级 是 -不可 测量 -的 
||| 数据 ， 也 就 是 分 类 数据 ! 
















REDS 

Siler BEM HB ey... x 
2. AAR 
za 







TORN OM RET Ey 
ge s | 














4. Am 
z 


这 份 读者 问卷 的 O1 中 ， 每 
个 选项 间 的 间隔 相等 吗 ? 





5. PRA, 
Q2. Aroni y, 
Or 


2 
3 .你 的 年 办 为 了 
Qu FRG AMRI KGS 





MAREBA 
RB / 












































il ! 
今天 的 课 就 上 到 这 里 。 




































































































































































































































































































































































































































FRM! 
Ett! 







































































































































































































































































































































































Z3 实务 中 “非常 有 趣 ”~“ 非 常 无 趣 ” 的 运用 只 


正如 25 页 中 所 述 ，“Q1. 读 完 哈 密 瓜 学 网 物语 第 五 集 的 感觉 为 …… 是 分 类 数据 。 
然而 ， 实 际 的 消费 者 问卷 调查 中 ， 数 值 数据 并 不 少见 。 也 就 是 



























































非常 有 趣 => 5 分 
有 点 有 趣 => 4 分 
一 般 => 3 分 
有 点 无 趣 => 2 分 
非常 无 趣 => ] 分 
或 是 
非常 有 趣 => 2 分 
有 点 有 趣 => 1 分 
一 般 = 0 分 
有 点 无 趣 => -1 分 
非常 无 趣 => -2 分 
以 这 种 方法 解释 数据 的 情况 并 不 少见 。 


理论 的 世界 和 实际 的 世界 ， 不 ， 客 套话 的 世界 和 真心 话 的 世界 也 应 该 存在 这 样 
的 区 别 。 无 论 如 何 ， 希 望 各 位 知道 ， 若 观点 不 同 ， 则 数据 的 获得 方式 也 有 可 能 会 不 
同 。 


28 第 1 章 确认 数据 种 类 


























a 

1 

1 

1 

: HWS 

8 对 运动 饮料 X 的 | aare m ap ga | 100 米 的 短跑 成 
J ae 评价 | 到 每 适 的 室温 | g) 

i : 

` A 同学 B 难 喝 25 14.1 

x B 同 学 A 好 喝 24 12.2 

' C 同 学 AB 好 喝 25 17.0 

i D 同 学 o Fi 27 15.6 

E 同 学 A 难 喝 24 18.4 

i : : : : : 

1 : | 

: 请 将 "血型 "、“ 对 运动 饮料 X 的 评价 "、“ 开 空调 令 人 感到 舒适 的 室温 ”、 
， “100 米 的 短跑 成 绩 "分 为 分 类 数据 或 数值 数据 。 

` 


“血型 "和 "对 运动 饮料 X 的 评价 "为 分 类 数据 。“ 开 空调 令 人 感到 舒适 的 室 


温 " 和 "100 米 的 短跑 成 绩 "为 数值 数据 。 


。 数 据 可 分 为 分 类 数据 和 数值 数据 。 
。“ 非 常 有 趣 "~ 非常 无 趣 "等 ， 在 理论 上 为 分 类 数据 。 然 而 ， 在 实务 上 ， 却 经 党 
将 其 视 为 数值 数据 。 















第 2 章 4 
掌握 数据 整体 的 状态 
( 数值 数据 篇 ) 


























外 1 次数 分 布 表 和 直方 图 宫 


= 














3 你 好 ， 琉 衣 。 


我 超 想 吃 呀 ! 

看 了 这 本 杂志 ， 不 知 
道 该 选 哪 家 ， 好 难 先 
a! 









































看 起 来 全 部 都 
超 好 吃 的 ， 对 
吧 ? 


R? 
你 喜欢 吃 拉面 
4? 





32 第 2 章 掌握 数据 整体 的 状态 ( 数值 数据 篇 ) 











怎么 又 开始 上 起 
RRT 








VLERARERER 








看 了 这 个 表格 ， JF 
有 什么 想法 吗 ? | 
k E 


aa 


PIY 
N 


光 看 数字 的 排列 ， 肯 定 
无 法 了 解 更 多 信息 。 


要 怎样 才能 让 这 个 
SERNAS ES 为 了 方便 整理 ， 首 先 ， 以 价格 
? 为 标准 进行 整理 ! 


ZZ 


CRT 

了 
o 
5 

o 

7 

9 

/0 

n 

12 * 

| Ñ 
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请 想象 一 下 ， 一 家 集结 
了 50 家 拉面 馆 的 百货 公 


























然后 ， 依 照 拉面 的 价格 层级 
分 楼 层 。 


像 这 样 的 分 区 ， 统 计 学 上 称 为 
a” 
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© ”各 楼 层 指南 
Ea) 
AERA) 





其 楼 层 的 店面 





每 层 楼 部 挂 一 块 看 
板 ， 显 示 该 楼 层 的 i ‘aoe 
中 间 价格 。 








4k 
100-008 | 





3% 
oson 4 








| tmp 650 


1% 
40-4008 2 




















因为 2 楼 是 600~700 日 元 ， 
所 以 标 着 650 日 元 。 


因为 这 家 百货 公司 以 价格 
范围 来 分 楼 层 ， 因 此 每 层 
的 店铺 部 不 一 样 哟 | 


UL 


3 楼 是 店铺 最 多 的 
一 县 耶 





sie W PA 那么 请 试 着 计算 一 下 三 楼 
BARE. 4 y e i 
4 “的 "相对 次 数 ”。 





1. 组 中 值 : Class Midpoint, 2. 次 数 : Frequency。 3。 相 对 次 数 : Relative Frequency。 
36 第 2 章 掌握 数据 整体 的 状态 ( 数值 数据 篇 ) 


Z> 
将 全 体 视 为 1 的 比例 。 


_ RBBB 












a 

3 楼 有 18 家 店铺 ， 总 共有 Re! 

50 家 ， 所 以 属于 700~800 日 元 的 这 组 ， 也 就 是 组 中 
值 为 750 日 元 的 拉面 馆 ， 其 相对 次 数 为 
0.36， 乘 以 100 后 ， 以 百分比 来 表示 ， 


18 _ 36 E 
18 LS 0360 | * 
50 100 N | 又 变 成 数学 问题 了 。 
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“美味 拉面 是 销 前 so0” 的 次 阁 分 市 衣 
FLIER? 





车 将 目前 为 止 读 到 
的 内 容 整 理 成 如 图 
所 示 的 “次 数 分 布 





c— 确实 ， 只 有 数字 的 话 会 
果然 还 是 数字 。 比较 难以 理解 ， 那 就 将 



































也 叫 柱状 图 ， 是 一 种 统计 
报告 图 ， 由 一 系列 高 度 不 
等 的 纵向 条 纹 表 示 数 据 分 


市 的 情况 。 ZN 





1. 次数 分 布 表 : Frequency Distribution Talbe。 2. 直方 图 : Histogram. 
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“美味 拉面 畅销 前 50” 的 次 阁 








分 布 表 制 成 的 直方 图 
RAIRE”, RA 
话说 ， 在 此 即 为 拉面 BSR (AWARE) 
的 价格 。 在 上 图 为 "次 数 "， 
15 
10 
长 条 的 宽度 即 为 
“WE”, 5 在 下 图 则 为 "相对 


次 数 "。 


550 650 50 850 950 
长 条 的 中 央 即 为 





0 
550 650 750 850 950 


你 说 的 “似乎 ”就 
是 重点 ! 

次 数 分 布 表 和 直方 
图 ， 就 是 为 了 让 人 
能 够 直观 地 掌握 全 
体 数据 的 状态 ， 而 
设计 出 来 的 ! 


我 似乎 或 多 或 少 
可 以 想象 了 。 





1. 变 最 : Variable。 2. 组 距 : Class Width 
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前 一 阵子 我 们 全 班 的 
女生 一 起 去 打 保 龄 球 


(bowling) T ! 


RA 
F A 


(boring) 








有 高 中 女生 会 做 











这 种 事 吗 ? 全 来 的 女生 ， 那 人 
不 是 很 多 呀 ! 
DE 山本 老师 ， 
gnant ; AT, BANIA, 
? gol J, 所 以 每 6 人 一 组 ， 分 
成 3 组 做 对 抗 赛 叱 | 
O 
ga N 
27 
A 











Ae 
(人 


z 


乍 看 之 下 ， 琉 衣 的 得 分 
WARE DAD EAR 
FR! 


对 呀 ! 
琉 衣 琉 衣 得 了 86 分 呢 | 


如 果 琉 衣 得 到 比 
所 谓 的 平均 分 就 是 各 队 平均 数 更 高 的 分 
中 每 个 人 的 大 概 得 分 ， 数 的 话 ， 要 请 我 

LERH! O 
































所 谓 分 队 比 赛 指 的 是 比 2 pp \ 
各 队 的 总 得 分 吧 ? 人 








AK 
Bb+73+(24 +/1/ +40438_ 522 
6 6787 


BR 


84+7I+103+85+90+89 _ 522 .87 
6 EJ 


CRA 
229+77+59+95+70+88 _ 618 
a D T2 


> 


TARR LER 
n 
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FEEL, MRM 
小 知识 吧 | 






































刚才 说 明 的 "平均 数 "， 其 实 严格 
aka ARFA" 其 他 还 有 ' 几 何平 均 2 及 "调和 
来 说 ， 应 该 称 1 
人 平均 数 "3" 竺 平均 数 。 
现在 先 别 管 算法 ， 先 把 名 称 记 下 








B3. ATHY 























被 视 为 "每 个 人 的 
大 概 得 分 "， 很 没 
道理 吗 ? 


先 不 看 4 队 和 
B 队 ， 你 不 觉 
得 C 队 的 平均 





与 其 求 平均 数 ， 不 
如 找 出 "中 位 数 "” 
较为 妥当 。 





没 错 。 得 分 只 有 2 位 数 的 
成 员 明明 有 5 人 之 多 ， 平 
均 数 却 超过 100。 
























































































































1. 中 位 数 : Mediano 
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首先 ， 将 名 队 得 分 依 大 小 
所 说 的 中 位 数 ， 是 顺序 排列 看 看 。 


指 将 数据 依 大 小 顺 
AAA, RPA 
的 值 。 


BBA TRA BH o 


itis -0 C1) bof r] 


piik 


— 


ARH ERA Ye 


数据 的 个 数 若 为 奇数 ， 则 正 CEMAAKHRRRAE— 

中 间 的 数据 即 为 中 位 数 。 艇 ， 数 据 的 个 数 为 锅 数 时 ， 则 
第 三 和 第 四 顺 位 的 数字 之 平均 
就 成 为 中 位 数 





46 


再 来 介绍 一 个 和 平均 数 
有 关 的 小 知识 …… 


那么 ， 经 常 在 报纸 或 电视 新 闻 
中 出 现 的 "日 本 ' 平 均 ' 储 著 额 "的 
数值 ， 你 没有 对 此 数值 之 高 感 
到 惊讶 吗 ? 


当然 有 呀 ! 


原来 除了 我 之 外 ， 其 他 人 居然 
LAB 
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KPRAW DORR 
RAH, KR, ik 
有 存 钱 的 习惯 吗 ? 








那个 数字 是 被 少数 的 超级 大 
富 箱 抬 高 的 。 






Bk, PRATHER 
比 " 平 均 " 值 低 相 当 多 ， 也 
不 必 因 此 感到 担忧。 





















































































































































































































































































在 这 种 情况 下 ， 也 许 求 中 位 
数 较 能 符合 一 般 民 众 的 平均 
Hi 







HO |! 
那 就 和 比 中 位 数 高 出 
许多 的 富 等 结婚 吧 | 









在 各 自 的 得 分 处 写 上 
姓名 后 





平均 元 
H 87, 
— :一 一 
0 D 100 
BREW i 


但 这 两 队 的 状况 大 
不 相同 吧 ? 
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像 这 样 为 了 表现 "离散 
是 呀 ，4 队 队员 的 得 分 程度 "所 使 用 概念 的 就 
REAR ARNE, j ý 是 "标准 差 '"。 
但 B 队 全 体 队员 的 分 数 
都 相当 接近 。 


kA 


大 至 上 来 说 ， 就 是 表示 N 
at ee ae 


标准 差 最 小 值 为 0， 而 数据 的 "离散 程度 ` 越 大 ， 
标准 差 的 值 就 越 大 。 


mt 
0 最 小 


A 
完全 不 离散 ae = 
全 全 为 相同 元 据 ) 





.标准 差 : Standard Deviation, 


只 要 在 这 里 填 入 具体 的 


数字 就 可 以 了 1 tt 
b 
+, ansar! || = CPI 


a EEE 240| 
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| 
6 
= [EVC HE Et 
6 


答对 了 ! 


你 也 可 以 做 
得 到 只 | 


= /H+4256+256+t414+4 
6 


BEA 
AK=27.5 BRK=9.5 


大 家 得 分 都 差不多 的 B 队 ， 
标准 差 确实 比较 小 耶 1 





LSS 
E77 Y 4 
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FREKARA, 把 数据 的 个 数 减 拓 
一 个 ! 


y- (每 二 数据 -平均 数 ) 的 总 和 
数据 的 个 数 








但 也 有 人 认为 应 当 是 





y- (每 一 数据 -平均 数 ) 的 总 和 
数据 的 个 数 -1 




















求 样本 的 标准 差 就 用 后 面 的 
公式 。 












总 体 是 真正 起 调查 的 
对 象 的 集合 ， 


而 样本 是 从 总 体 中 被 
选 出 来 的 人 所 形成 的 
A, 
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如 果 可 以 像 琉 衣 的 保龄球 队 
一 样 ， 忒 得 可 个 集合 的 数据 
就 好 了 。 


所 以 大 部 分 部 是 使 用 
后 面 的 公式 。 





那么 ， 今 天 的 课程 
就 到 此 结束 。 
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8 5. 次数 分 布 表 的 组 距 客 


至 此 ， 也 许 有 些 人 仍然 无 法 完全 理解 “1. 次 数 分 布 表 和 直方 图 ”， 我 们 就 再 做 一 
些 详细 的 说 明 吧 。 
下 表 同 第 38 页 的 曾 使 用 过 的 表 。 








如 各 位 所 见 ， 上 表 中 的 组 距 是 100。 之 所 以 先 择 100， 并 没有 什么 数学 上 的 规 
定 ， 而 是 全 由 山本 老师 主观 决定 的 。 没 错 ， 组 距 该 设 多 少 ,完全 依照 分 析 者 本 身 的 
判断 。 

“以 主观 设 定 的 组 距 而 做 成 的 次 数 分 布 表 并 没有 说 服 力 ， 无 法 在 他 人 面前 公 
开 ， 难 道 就 没有 按 数学 原理 制定 组 距 的 方法 吗 ? ”也 许 有 人 会 产生 这 样 的 疑问 。 事 
实 上 ,方法 是 有 的 。 步 骤 如 下 页 所 述 。 既 然 已 经 有 数据 了 ， 就 让 我 们 来 看 看 ， 如 果 
以 表 2.1 来 试 算 会 产生 什么 样 的 结果 。 
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“组 ”的 个 数 即 组 数 可 以 使 用 史 特 吉 斯 公式 进行 计算 ， 即 : 
i log, 数 据 的 个 数 
log, 
求 出 。 
log,,50 S 
a O 一 6.6438… 一 
-a 
组 距 以 
(数据 的 最 大 值 ) 一 (数据 的 最 小 值 ) 
用 史 特 吉 斯 公式 求 出 的 组 数 
求 出 。 
980—500 _ 480 
= =68.5714---~69 
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以 步骤 2 求 出 的 组 距 为 基础 ， 做 出 如 下 的 次 数 分 布 表 。 






638~707 





707~776 
776~845 0.20 
845~914 0.20 
914~983 0.14 

合计 | | 50 | 1.00 


结果 如 何 ? 各 位 不 觉得 这 样 反 而 做 出 了 一 张 比 表 2.1 还 令 人 无 法 理解 的 表格 吗 ? 
也 就 是 说 ， 难 道 各 位 不 会 抱 着 “为 何以 69 元 为 组 距 呢 ? ”的 疑问 吗 ? 然后 ， 即 使 你 
努力 地 说 明 : “这 是 使 用 史 特 吉 斯 公式 求 出 的 ……” 你 不 觉得 还 是 会 被 质问 : “ 谁 
知道 史 特 吉 斯 公式 是 什么 呀 ! 到 底 为 什么 要 采用 这 么 难以 解释 的 组 距 呢 ?3 ” 

总 而 言 之 ,也许 有 人 会 质疑 以 主观 设 定 组 距 的 合理 性 。 但 另 一 方面 ， 我 们 从 上 
表 可 以 清楚 得 知 ， 即 使 用 数学 方法 设 定 组 距 ， 却 时 常 还 是 会 产生 不 尽 理想 的 结果 。 
因此 ， 这 个 方法 是 否 恰当 ， 须 重新 思考 。 但 是 ， 我 个 人 觉得 原先 的 次 数 分 布 表 就 是 
用 来 掌握 数据 整体 的 “气氛 ”， 因 此 ， 以 分 析 者 可 接受 的 组 距 来 处 理 即 可 。 
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必 6. 推 断 统计 学 和 描述 统计 学 实 





在 序章 中 ， 有 这 样 一 段 解说 : “所 谓 的 统计 学 ， 即 为 从 样本 的 信息 推测 总 体 状 
况 的 学 问 。” 其 实 这 段 解说 并 不 恰当 。 

统计 学 可 分 为 推断 统计 学 和 描述 统计 学 两 类 。 序 章 所 解说 的 为 前 者 。 那 么 ， 后 
者 的 描述 统计 学 到 底 是 什么 呢 ? 也 就 是 借 由 整理 资料 ， 尽 可 能 简单 明了 地 显示 出 整 
体 状 况 为 目的 的 统计 学 。 即 ， 将 对 象 集合 视 为 一 个 总 体 的 统计 学 。 

描述 统计 学 的 解说 可 能 由 于 过 于 抽象 而 让 人 难以 理解 。 让 我 再 举 个 例子 说 明 。 
刚才 山本 求 出 了 琉 衣 队 得 分 的 平均 数 和 标准 差 。 他 求 出 此 两 者 的 目的 ， 并 非 为 了 推 
测 总 体 的 状况 。 以 琉 衣 队 为 样本 的 总 体 ， 究 竟 是 怎样 的 总 体 呢 ? 简 而 言 之 ， 山 本 之 
所 以 求 出 平均 数 和 标准 差 ， 仅 仅 是 为 了 简洁 地 表示 琉 衣 队 的 状况 。 这 样 的 统计 学 即 
为 描述 统 












下 表 为 高 中 女子 100 米 短跑 的 成 绩 表 





(1 ) 请 求 出 平均 数 。 
(2) 请 求 出 中 位 数 。 
(3 ) 请 求 出 标准 差 。 
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58 


和 
解答 


16.3 十 22.4 十 18.5 十 18.7 十 20.1 _ 96 


(1 ) 平均 数 是 5 





三 19.2 


(2) 中 位 数 是 18.7 





16.3 18.5 20.1 22.4 








(3 ) 标准 差 是 





(16.3—19.2) +(22.4—19.2 +(18.5-19.2} +(18.7—19.2) +(20.1-19.2} 
5 








= J C29 +3.22 +0. +057 +09 
5 


_ [841+ 10.24 +0.49 +0.25 +0.81 
5 
- [m2 
5 


=y 4.04 
= 2.01 


* 利 用 “直觉 ”掌握 整体 数据 的 “氛围 ”的 方法 有 : 次 数 分 布 表 及 直方 图 。 
* 设 定 次 数 分 布 表 的 组 距 可 采用 史 特 吉 斯 公式 。 


* 用 数学 原理 掌握 全 体 资料 “氛围 ”的 方法 有 ， 算 术 平均 数 、 中 位 数 和 标准 差 。 
。 当 存在 过 大 或 过 小 的 数据 时 ， 中 位 数 较 平均 数 更 能 正确 掌握 数据 状态 。 
。 标 准 差 为 表示 数据 “离散 程度 ”的 指标 。 
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第 3 章 4 
掌握 数据 整体 的 状态 
( 分 类 数据 篇 ) 
























































原来 是 格 绞 的 
e KPRM 
À 
\ 还 真 少见 
Ca 
es ey 
oo 
° ktt o J 
新 校服 问 着 调查 





+! 
这 份 问卷 就 是 分 类 
KEN! 




































































我 们 班 上 还 做 了 
问卷 调查 呢 ! 


结果 就 是 这 样 。 


对 路 ! 
因为 “喜欢 ”和 “ 讨 
质 ” 是 不 可 测量 的 数 
A E. 
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那么 ， 为 了 掌握 整体 数据 
的 情况 ， 我 们 先 来 做 一 张 


有 28 人 回答 喜 
八 。 欢 ， 所 以 是 28。 
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新 校 腿 如 何 ? 

















































































































为 了 便于 你 的 理解 ， 我 们 来 


做 成 图 表 形式 吧 ! 


ARBRE, OE “Ak” t 
人 超过 计数， 因此 这 款 校服 的 J 
设计 似乎 还 变 讨 人 喜欢 的 。 因为 真 的 很 可 爱 Ų 








Mmi : 补充 一 下 ， 我 也 插 
， “ 音 欢 ”的 。 
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: Ga 

| 某 家 报社 对 有 意 执掌 下 届 政 权 的 AA 党 ， 做 了 份 问卷 调查 表 。 结 果 如 下 表 
1 所 示 。 [oe 
1 相 较 于 OO 党 ， 

4 AA 党 …… 

i 回答 者 1 不 值得 期 竺 

i 回答 者 2 不 值得 期 竺 

: 回答 者 3 不 值得 期 竺 

1 回答 者 4 没 意 见 

回答 者 5 值得 期 待 

1 回答 者 6 不 值得 期 竺 

回答 者 7 值得 期 竺 

‘ 回答 者 8 没 意 见 

1 回答 者 9 不 值得 期 竺 

z 回答 者 10 不 值得 期 待 

， 请 将 此 问卷 调查 表 结果 做 成 “次 数 分 布 表 ”。 

i 

> “次 数 分 布 表 ”如 下 所 示 。 

次 数 “| 比例 (%) 
i 值得 期 待 2 20 

1 没意思 2 20 
“值得 期 待 6 60 

i 合计 10 100 

















。 做 成 “次 数 分 布 表 ” 为 掌握 数据 整体 状态 的 方法 之 一 。 
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第 4 章 
标准 计 分 和 离 差 


























g1 标准 化 和 标准 计 分 罚 - | 





今天 我 和 我 的 朋友 由 美 一 起 在 
A aA 你 好 | | | 外 面 上 课 。 
/2 4 BE n 
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\ 


和 
3 

但 为 什么 由 美的 古文 成 绩 的 a 

N 高 差 比较 高 呢 ? $ 
< 2 


















































这 是 因为 英语 和 古文 
的 分 数 价值 不 同 。 


bl 









mrs 
ya 
l "ò 


考试 成 绩 (100787) 


H 
Fi 
J 
x 
L 
M 
N 
oO 
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8.74 


813 90 [00 
Ko—/ 信 外 一 


a". 





743 90 100 


如 此 一 来 ， 就 可 以 知 
请 试 着 比较 看 看 距离 道 就 算 同 样 考 90 分 


R 平均 值 的 远近 。 但 各 自 的 “含金量 ” 
是 不 同 的 了 吧 ! 


那么 ， 竺 会 就 请 你 
narte! / 


不 过 90 分 已 经 
BRETT! 
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历史 和 生物 的 平均 
TRASI! 

















但 是 为 什么 离 差 还 是 
不 一 样 呢 ! 


ea M ; ~ 


A! 
那 每 个 科目 的 标 P 
RE'D AMES 你 是 指数 据 的 


少 呢 ? “离散 程度 ” 


4 











Z 

















COB’ CAG£ 





1. 标准 差 : Standard deviation, 
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© 


标准 差 越 小 ， 代 表 这 组 数据 的 
“离散 程度 ”也 越 小 。 


所 以 比 起 历史 ， 大 家 的 生物 课 
成 绩 较 为 接近 。 


从 考试 的 角度 来 说 ， 
就 是 生物 的 1 分 比较 
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的 
排 


此 ， 即 使 中 有 一 两 分 
差距 ， 也 会 大 大 影响 
名 。 





将 分 数 的 价值 转换 成 
易于 讨论 的 数据 ! 








wannterane ) (每 一 数据 ) 一 FHR) 标准 计 分 


标准 


标准 化 后 的 数据 ， 称 为 
“标准 计 分 ” 





那么 ， 实 际 试 算 一 下 刚才 的 
考试 成 绩 吧 ! 


历 器 和 生物 的 姓 斌 成 织 及 其 标准 计 分 


AEREA] 生物 的 标准 
半分 半分 





BR 
由 美 
A 
B 
C 
D 
€ 
F 
6 
H 
$ 
J 
x 
L 
“M 
N 
° 
p 








. 73-53 __20_-_ 9.99 
mxunewmaie 2-3 -327 


3-53 s 
四 美的 生物 标准 计 分 -了 7253 





1. 标准 计 分 : Standard Score. 


72 84% 标准 计 分 和 离 差 


标准 化 后 ， 求 出 标准 计 分 具有 
REE. 
























































HD A107 HBB 
_ AH N2007 0B 
@ 无 论 作为 变量 的 满分 为 几 分 ， 其 标准 计 分 的 平均 数 5 
势必 为 0， 而 其 标准 差 势必 为 1 


安打 认 和 全 全 打数 等 
@ 无 论 作为 变量 的 单位 是 什么 ， 其 标准 计 分 的 平均 数 即 借 单 位 不 同 世 可 以 
势必 为 0， 而 其 标准 差 势必 为 1 


ateata, N (marag 


0.88 < 1.09 
(历史 ) (生物 ) 


因此 ， 哪 一 个 73 分 较 有 价值 ， 
我 起 应 该 可 以 很 明显 地 看 出 来 
了 吧 ! 
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而 且 ， 离 差 就 是 应 用 标准 计 分 


所 得 的 数值 易 


来 算 算 看 ， 你 们 考 
试 分 数 的 离 差 吧 


1.09 X 10+50=10.9+50=60.9 


iy 
AS) 是 护 个 结果 一 


“| 标准 计 分 


第 4 章 标准 计 分 和 离 差 


@ 无 论 作 为 变量 的 满分 为 几 分 ， 其 标准 计 分 的 
平均 数 势必 为 0， 而 其 标准 差 势必 为 1。 

@ 无 论 作为 变量 的 单位 是 什么 ， 其 标准 计 分 的 
平均 数 势必 为 0， 而 其 标准 差 势必 为 1。 


@ 无 论 作为 变量 的 满分 为 几 分 ， 其 离 差 的 平均 | | 


数 势必 为 50， 而 其 标准 差 势必 为 10。 | 
@ 无 论 作 为 变量 的 单位 是 什么 ， 其 离 差 的 平均 
数 势必 为 50， 而 其 标准 差 势必 为 10。 





算 只 是 一 分 之 差 也 影响 
深远 ， 所 以 才 会 使 用 离 
差 这 个 指标 吧 ! 
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在 此 ， 有 必要 加 强 离 差 的 解说 。 
离 差 如 同 74 页 的 解说 ， 是 以 下 述 算式 求 得 的 : 


(每 一 数据 ) - (平均 数 ) 


离 差 = 标 准 计 分 x 10+50= = x 10+50 
标准 差 


那么 ， 琉 衣 的 班 上 ， 如 同 61 页 中 说 明 的 ， 全 班 共有 40 人 。 琉 衣 班 上 的 “ 女 
生 ”， 如 40 页 所 示 ， 共 有 18 人 。 所 以 69 页 的 离 差 实例 ， 并 非 以 全 班 同学 为 对 象 ， 而 
仅 以 女生 为 对 象 。 若 以 全 班 同学 为 对 象 ， 平 均 数 和 标准 差 的 值 就 会 和 仅 以 女生 为 对 
象 时 迎 然 不 同 ， 琉 衣 和 由 美的 离 差 值 也 势必 有 差异 产生 。 实 际 上 ， 若 以 全 班 同学 为 
对 象 的 情况 下 ， 琉 衣 的 离 差 值 较 高 。 全 班 的 测验 结果 如 表 4.1 所 示 。 请 各 位 务必 试 着 
算 算 离 差 。 我 先 将 答案 说 出 来 ， 琉 衣 的 历史 成 绩 离 差 值 为 59.1， 而 由 美的 生物 成 绩 离 
差 值 为 56.7。 


另外 ,假设 在 2 年 1 班 及 2 年 2 班 也 举办 了 相同 的 测验 。2 年 1 班 只 求 出 自己 班 上 的 
平均 数 和 标准 差 ， 再 以 此 为 基础 ， 求 出 离 差 值 。2 班 也 只 求 出 自己 班 上 的 平均 数 和 标 
准 差 ， 再 以 此 为 基础 ， 求 出 离 差 。 结 果 ，1 班 的 A 同学 和 B 同 学 实力 相当 。 然 而 ， 由 于 
求 出 A 同学 和 B 同 学 的 离 差 值 时 ， 所 采用 的 平均 数 和 标准 差 并 不 一 致 ， 既 然 两 班 的 平 
均 数 和 标准 差 并 不 相同 ， 那 么 两 人 的 离 差 值 并 无 可 比 性 。 


我 再 举 个 例子 ，A 同 学 于 4 月 间 参 加 了 某 补 习 班 的 模拟 测验 ， 其 考试 成 绩 的 离 差 
值 为 54。 而 在 暑期 补习 班 中 努力 用 功 的 A 同 学 ， 为 了 想 确认 实力 提升 了 多 少 ，9 月 间 
又 参加 了 另 一 个 补习 班 所 举办 的 模拟 测验 ， 其 考试 成 绩 的 离 差 值 为 62。 从 两 次 离 差 
值 来 看 ， 乍 看 之 下 ，A 同 学 的 实力 似乎 有 所 提升 。 然 而 ， 由 于 4 月 和 9 月 之 模拟 测验 分 
数 的 举办 者 不 同 ， 因 此 考生 不 相同 。 再 加 上 ， 从 4 月 与 9 月 的 考试 结果 ， 在 欲求 出 离 
差 之 际 ， 所 使 用 的 平均 数 与 标准 差 一 定 不 同 ， 因 此 无 法 就 两 者 得 出 的 离 差 做 比较 。 


各 位 觉得 如 何 呢 ? 关于 离 差 的 解释 ， 相 当 有 深度 啊 ! 
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a 

b 93 7 

c 91 98 

d 37 85 

e 44 100 

f 16 29 

g 12 57 

h 44 37 

i 4 95 

j 17 39 

k 66 70 

1 53 14 

m 14 97 

n B 39 

o 6 75 

p 2 80 

q 69 7 

g 95 14 

s 16 24 

t 37 91 

u 14 36 

v 88 16 
全 班 同学 成 绩 的 平均 数 48.0 54.9 
全 班 同学 成 绩 的 标准 差 27.5 26.9 
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r 
1 

: Ee : 
E 下 表 为 高 中 女子 100 米 的 短跑 成 绩 。 ' 
1 

i TOOK : 
i Œ) z 
= A 同 学 163 : 
1 B 同 学 22.4 
Li L 
1 C 同 学 18.5 i 
ja 18.7 8 
L 1 
1 20.1 1 
' 19.2 ' 
1 an ae 1 
1 标准 差 2.01 z 
1 1 
1 (1 ) 请 确认 “100 米 短跑 成 绩 的 标准 计 分 ”之 平均 数 是 否 为 0。 1 
1 > J 

i i 
` 
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Li 
a 
(1)“100 米 短跑 的 标准 成 绩 ” 之 平均 数 1 
1 

163-192) , (224-192) , (185-192) , (187-192) , (201-192 
201 ]+[ 201 ]+[ a ]+[ 201 ]+[ 201 ) : 
1 
pe 192)4024-192)+018.5-19. iti 19.2)+(20.1— sa) 1 
- 1 
全 : 
163 十 22.4 十 185 十 187 十 20.1-192-192-192-192- 192} 1 
3 201 1 
' 
96-192x5 1 
_ 201 1 
= A 
96-96 ' 
2.01 ' 
ae 1 
-e 1 
25 1 
=0 1 
1 
2) “100 米 短跑 的 标准 计 分 ”之 标准 关 
163-192, },(224-192 下 [185-192 下 [187-192 o },(20.1-192 ,) © 
( 201 -ot 201 -oH 201 -oH 201 -oH 201 -0) 1 
i 5 
163-192)’, (22.4-19.2)', (185-192), [187-192| (20.1-192 Ý i 
| 201 J+ 201 J+ 201 +( 201 J+ 201 ] t 
Š : : 
we ' 
201? 5 
1 
Li 
= 1 
Li 
1 
g 1 
1 
”的 标 ; Li 
1 
Li 
1 
1 
1 
1 
Lona ane Na Cee aaa aes eS ara 
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“标准 化 即 为 ， 以 距离 平均 数 的 远近 程度 及 数据 的 “离散 程度 ”为 基础 ， 将 数 
据 的 价值 转换 为 易于 探讨 的 数值 。 
* 若 执行 标准 化 ， 则 可 以 比较 


。 满 分 不 同 的 变量 
“单位 不 同 的 变量 


。 标 准 化 后 的 数据 称 为 标准 计 分 。 
。 求 离 差 值 必须 应 用 到 标准 计 分 。 
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统计 学 中 有 时 会 提 到 “ 某 终于 要 开始 进入 机 率 的 
业 机 率 ” 小 于 0.05 课程 了 。 





我 还 是 喜欢 
Atke 


山本 老师 不 是 条 件 超 好 
吗 ? 


M! 
但 是 ， 从 现在 起 所 学 的 知识 ， 


tk 
那 机 率 是 指 会 出 现在 天 所 预报 在 统计 学 中 会 常 党 出现， 一定 


中 的 那 种 机 率 吗 ? 要 认真 听讲 只 
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人 县 的 全 体高 三 学 生 英 语 测 骆 结果 


英语 测验 结果 
ST RADAR 
语 测验 ， 结 果 如 下 。 
假设 A 县 的 会 休 
高 三 学 生 ， 





今天 倒是 做 了 
万 全 准备 嘛 。 





英语 测验 结果 的 直方 四 (组 中 为 10) 苦 将 这 从 直方 国 的 组 
Eih, WRAL AE 
a! 如 何 呢 ? 
果然 做 成 直方 图 后 
WREDEN! 


因为 视觉 效 D 


果 比 较 地 ! 
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组 距 和 “英语 测验 结果 ”的 直方 图 


04 


! 


渐渐 接近 于 曲线 痢 ! 
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直方 图 中 ， 将 距离 缩小 至 极 
限 后 ， 所 得 之 曲线 的 公式 ， 


在 统计 学 上 称 为 “机 














DAK HH 85 BH, 
理论 上 是 像 上 图 一 样 具 ONO 
有 各 种 形态 的 。 


1. 机 率 密度 函数 Probability Density Function, 简 称 “pdf” o 


今天 将 为 你 介绍 特别 
重要 的 几 种 图 形 。 
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&2. ESD E 












SRP? 





1 
A) 5 Tam x xa 









这 是 在 统计 学 上 经 
常 出 现 的 机 率 密度 


这 是 什么 鬼 东 桓 
Fl ? 



























“e” 被 称 为 “自然 对 数 的 底 ” 
其 值 大 约 为 27182…… 


















































p EMA “n” R 
&, 似 的 数 就 好 了 1! 
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园 平 均值 为 53， 标 准 着 为 15 








0,08 ral 
RAE RH _ HEET 
形 ， 具 备 以 下 特征 : 0.06 forme” 

。 以 平均 值 为 中 心 旺 友 ù 
右 对 称 
。 受 到 平均 值 和 标准 差 002, 
的 影响 
0 
be 








GEAGNS, TEŽ As 
0.08 





006 
0.04 














贺 平 均值 为 ?0， 标 准 卷 为 5 
0.08 J 


29 
forg T 














0.06 
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x 的 机 率 密度 协 数 若 为 刚才 的 算式 : 


_ 工 [ boxe) 


1 4 
= RAE 
x) = Saxman?” 


则 统计 学 上 ， 以 “x 服 从 平均 值 为 OO， 标准 差 为 XX 的 正 态 分 布 ”来 表 
示 





总 之 ,虽然 算式 有 些 
复杂 ， 但 还 是 请 你 努 
力 理解 吧 ! 










































































PHAS, AŽ AKERRA 





那么 ， 我 们 以 刚才 考试 
的 例子 来 作 一 下 解说 。 





53 
divin! ort 
AZ X10 


如 果 “ 英 语 测验 结果 ” 
HARRERAK EEA 
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就 会 以 ““ 英 语 测 验 结果 ”服从 平均 
值 为 53， 标 准 差 为 10 的 正 态 分 布 ” 来 
表示 。 








83. 标准 正 态 分 布 k 

yy ， 1 
那么 ， 来 进行 OS 

下 一 个 问题 。 | 人 


























XA PUR HE A HH 
boxe ea) 


ee ee 
ts) = Groen oO 


则 不 会 以 “x 服从 平均 值 为 0， 标 准 差 为 1 的 正 态 分 布 ”来 表示 ， 在 统计 学 上 会 以 
“x 服从 标准 正 态 分 布 ” 来 表示 。 








让 我 们 仍 以 刚才 的 “英语 “英语 测验 结果 ”服从 平均 值 为 53 ， 
测验 结果 ”的 例子 来 看 ! 标准 差 为 10 的 正 态 分 布 。 













































































测 
英语 测验 结果 yeni 


a (| 
3.2 


每 一 格 招 -平均 值 _ 
TAA 


如 果 这 样 ， 则 标准 化 后 的 “英语 测 
验 结果 ”为 …… 





BRERDA 











FARLAM! 









































再 走 一 小 段 路 就 能 看 
到 目的 地 了 1 





2 什么 ? 
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SSS a 


OoOO ESAR 
z | 0.00 | 0.01 0.02 0.03 | 0.04 | 0.05 0.06 0.07 0.08 | 0.09 
0.0080 | 0.0120 | 0.016 | 0.0199 0.0279 | 0.0319 
0.0478 | 0.0517 | 0.0557 | 0.0596 0.0675 | 0.0714 
0.0871 | 0.0910 | 0.0948 | 0.0987 0.1064 | 0.1103 



























0.0398 
0.0793 


0.0438 
0.0832 




















0.4641 
0.4713 


0.4699 
0.4761 


0.4693 
0.4756 


0.4664 | 0.4671 | 0.4678 
0.4732 | 0.4738 | 0.4744 


0.4656 
0.4726 


0.4649 
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那么 ， 我 们 假设 
z=1.96 来 看 一 下 。 





0.01 | 0. | . . . .08 |? 
0.0040 7 | iy 
0.0438 有 . 有 . . 

0.4693 | 0.4699 | 0.4706 


0.0832 














“1.9” 的 行 和 “0.06” 的 
列 之 交叉 处 …… 


有 ! 

差点 忘 了 告诉 你 ， 所 有 的 标准 正 态 分 布 
之 机 率 害 度 函 数 的 图 形 和 横 轴 所 转 成 的 
RAZIA! 


是 的 ! 
这 就 是 z=1.96 时 的 面积 。 





那么 ， 现 在 开始 要 说 明 的 内 容 就 是 
今天 的 “ 主 莱 ”。 请 用 心 听讲 。 


标准 正 态 分 布 的 图 形 和 横 轴 围 成 的 面积 ， 
与 其 比例 及 机 率 是 相同 的 。 
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四平 均值 为 44， 标 准 差 为 10 的 正 态 分 布 表 中 ， 下 图 斜 线 部 分 的 面积 为 0.5。 





0.05 
0.04 
0.03 
0.02 





0.01 











0 n 
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100 











加 得 分 在 45 分 以 上 的 考生 比例 ， 占 全 体 考生 总 数 的 0.5 (=50% ) 。 

@ 从 全 体 考生 中 ， 随 机 抽出 一 人 ， 其 得 分 在 45 分 以 上 的 机 率 为 0.5 (=50% ) 。 

@ 在 “数学 测验 结果 ”标准 化 后 的 标准 正 态 分 布 中 ，0 以 上 的 考生 比例 ， 占 全 体 
考生 总 数 的 0.5 (=50% ) 。 

















0.29 


© 从 全 体 考生 中 ， 随 机 抽出 一 人 。 在 “数学 测验 结果 ”标准 化 后 的 标准 正 态 分 
布 中 ， 他 的 标准 计 分 为 0 以 上 的 机 率 为 0.5 (=50% ) 。 
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因为 平均 值 是 45 分 ， 所 以 可 
以 画 出 以 45 分 处 为 高 峰 ， 左 
右 对 称 的 图 形 。 


其 中 得 分 在 45 分 以 上 的 ， 正 好 占 
图 形 的 右 半边 ， 因 此 是 50% 。 


H 
AÀ 








这 种 程度 的 内 容 我 
当然 可 以 理解 只 。 feed FSS Ty 
那么 例 卫 为 例 I 的 应 


AAR! 
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> Y 


@ 平 均值 为 45， 标 准 差 为 10 的 正 态 分 布 中 ， 下 图 斜 线 部 分 的 面积 为 
0.5-0.4641=0.0359. 





0.05 





0.04 


0.03 


0.02 


001 











0 
0 5 10 15 20 25 30 35 40 45 50 55 60)65 70 75 80 85 90 95100 
8 











@ 得 分 在 63 分 以 上 的 考生 ， 占 全 体 考生 的 0.5-0.4641=0.0359 ( =3.59% ) 。 

图 从 全 体 考生 之 中 ， 随 机 抽出 一 人 ， 其 得 分 在 63 分 以 上 的 机 率 为 
0.5-0.4641=0.0359 (=3.59% ) 。 

图 在 “数学 测验 结果 ”标准 化 后 的 标准 正 态 分 布 中 ， 


05 


























一 18 _63-45 _ 每 一 数据 -平均 值 _ |， = 
lee REE 以 上 的 考生 比例 ， 从 标准 正 态 分 布 表 可 


清楚 得 知 ， 占 全 体 考生 的 0.5-0.4641=0.0359 ( =3.59% ) 。 
@ 从 全 体 考生 之 中 ， 随 机 抽出 一 人 。 在 “数学 测验 结果 ”标准 化 后 的 标准 正 态 
分 布 中 ， 他 的 标准 计 分 为 1.8 以 上 的 机 率 为 0.5-0.4641=0.0359 (=3.59% ) 。 
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不 仅 限于 标准 正太 分布， 无 
论 是 哪 种 机 率 密度 函数 ， 
面积 = 比例 = 机 率 

的 关系 都 是 成 立 的 。 


请 务必 记 住 吻 ! 





接 下 来 ， 我 来 介绍 下 一 个 NO y 
机 率 密度 函数 吧 ! Z 


Ed 
= 
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上 述 以 外 的 情况 则 为 0 
在 统计 学 上 ， 用 “x 服 从 自由 度 ? 为 OO 的 卡 方 分 布 ” 来 表示 。 


因为 琉 衣 的 反应 
很 有 趣 ， 所 以 才 


若非 数学 家 则 不 必 对 这 个 式 子 
进行 讨论 ， 因 此 请 不 要 担心 。 ei 























1 卡 方 分 布 :Chisquare Distributions 


2. 自由 度 : Degree of Freedoms 





总 之 ， 先 来 看 看 自由 
度 为 2、10 以 及 20 等 
情况 下 的 图 形 吧 ! 





国外 由 庶 为 2 的 情况 
0.5 


04 


自由 度 不 同 ， 图 形 
的 形状 也 完全 不 同 
有 ! 


自由 度 为 1o 的 情况 
fo. 






































(0 S 20 2% 3 35 4 
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没 错 ! 
1 次 函数 /x)=ax+b 之 中 ， Fax+ 随 着 @ 值 的 改变 ， 图 形 


4 称 为 什么 呢 ? 的 倾斜 度 也 会 跟着 改变 


“自由 度 ” 和 “斜率 ”一 样 ， 部 
是 会 影响 图 形 形 状 的 数值 。 


所 以 只 要 自由 度 的 值 有 所 
改变 ， 图 形 的 形状 也 会 随 
之 改变 。 
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就 像 标准 正 坊 分布 有 标准 正太 
分 市 表 一 样 ， 卡 方 分 市 也 有 l 
方 分 市 表 。 Wz 


il 
T 


fi ‘a 
(Nas 


it 


a 
























































那 读 做 “ 卡 方 ”。 


0.995 0.05 | 0.025 0.01 0.005 


0.000039| 3.8415 | 5.0239 | 6.6349 | 7.8794 
0.0100 5.9915 | 7.3778 | 9.2104 | 10.5965 
0.0717 7.8147 | 9.3484 | 11.3449 | 12.8381 
0.2070 9.4877 | 11.1433 | 13.2767 | 14.8602 
0.4118 11.0705 | 12.8325 | 15.0863 | 16.7496 
0.6757 12.5916 | 14.4494 | 16.8119 | 18.5475 
0.9893 14.0671 | 16.0128 | 18.4753 | 20.2777 
1.3444 15.5073 | 17.5345 | 20.0902 | 21.9549 
1.7349 16.9190 | 19.0228 | 21.6660 | 23.5893 
2.1558 18.3070 | 20.4832 | 23.2093 | 25.1881 





-RR = 


S 


























RERESDE 
表 很 类 似 耶 ! 


虽然 很 像 ,但 还 是 
AARAA! 





标准 正 态 分 布 表 为 记录 对 应 证 方 分 布 表 则 是 记录 对 应 
横 轴 的 刻度 之 机 率 的 表 ， 机 率 之 横 轴 刻度 的 表 。 











试想 一 下 ， 自 由 度 为 1， 239 
为 0.05 时 的 Xx? 的 值 。 








的 值 ， 所 以 …… 7 就 是 3.8415。 
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5. tt 





统计 学 上 ， 以 下 的 机 率 密度 函数 经 常 出 现 。 


自由 度 +1 r 自由 度 十 1 
fix 2 ter de 2 





joe a al 
ARE xmxox 2 ede 


x 的 机 率 密度 函数 若 如 上 述 ， 在 统计 学 上 则 以 “x 服 从 自由 度 为 x x 的 分 配 ” 来 
表示 。 


图 自由 度 为 5 的 情况 








0.6; 


05| 


04) 
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统计 学 上 ， 以 下 的 机 率 密度 函数 也 是 经 常 出 现 的 主题 。 


(fox MME a) (LEB) EE (第 2 自由 度 AE P aal 


(parE eae) (fx a) (1 自 由 x+ 第 2 自由 度 SE 








sofa 
上 述 以 外 的 情况 为 0 
x 的 机 率 密度 函数 若 如 上 述 所 示 ， 在 统计 学 上 则 以 “x 服 从 自由 度 为 DO， 第 2 自 


由 度 为 x x 的 F 分 布 ”来 表示 。 
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国 第 1 自由 度 为 10， 第 2 自由 度 为 5 的 情况 








& 


01 














| &7. “XXt” AEXCEL & 





如 果 不 使 用 标准 正 态 分 布 表 及 卡 方 分 布 表 来 计算 机 率 及 横 轴 的 刻度 ， 在 电脑 尚 
未 普及 时 ( 约 是 20 世 纪 90 年 代 初 期 ) ， 这 些 计算 对 个 人 而 言 是 相当 浩大 的 工程 。 因 
此 ， 这 些 分 布 表 实在 是 相当 重要 的 “宝物 ”。 然 而 ， 现 今 已 经 不 太 使 用 分 布 表 了 。 
因为 使 用 EXCEL 的 函数 计算 功能 ， 便 可 轻松 地 求 出 分 布 表 中 的 值 ， 不 仅 如 此 ， 比 起 
分 布 表 ，EXCEL 还 可 以 求 出 更 多 种 类 的 值 。 

我 将 与 “x x 分配 ”相关 的 函数 总 整理 如 下 表 。 


令 表 5.1 与 “X X 分 配 ” 相 关 的 函数 


NOPMDIST 






ST HAMAS 





1. 正 态 分 布 : 由 于 正 态 分 布 的 机 率 密度 函数 受到 平均 值 和 标准 差 的 影响 。 因 此 即使 想 做 出 “ 正 态 分 布 表 ” 
也 是 不 可 能 的 。 然 而 ， 利 用 EXCEL 来 求 出 与 “ 正 态 分 布 表 ”相当 的 值 却 非常 便利 。 
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下 图 斜 线 部 分 的 机 率 。 
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“代表 性 的 机 率 密度 函数 ， 可 举 出 与 下 列 对 应 者 : 
a ES 
曙 标 准 正 态 分 布 
ahaa 
mei 


m Fót 
。 机 率 密度 函数 的 图 形 和 横 轴 所 围 成 的 面积 为 1。 
。 机 率 密度 函数 的 图 形 和 横 轴 所 围 成 的 面积 ， 可 视 为 与 比例 及 机 率 相同 。 
。 若 利用 “x x 分 布 表 ” 或 Excel 的 函数 ， 则 可 求 出 ， 

里 对 应 横 轴 刻度 的 机 率 

里 对 应 机 率 的 横 轴 刻 度 
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双 变量 的 相关 分 析 






































你 那 是 什么 打扮 呀 ! 
FRBF TC! 








回身 高 ”和 “体重 ”的 散布 图 (Scatter Diagram) 


a 
W 
EN 


AaBZAIssy 


($8 (60 (62 (64 166 (68 170 172 
| eS ee ee. | 


“喜欢 的 啤酒 品牌 ”和 “年 龄 ”的 散 而 图 


做 成 图 表 后 ， 我 们 就 
可 以 知道 它们 是 否 与 
双 变 量 相 关联 。 
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RTH | 
我 们 无 法 确切 得 知 两 者 
关联 的 程度 。 


Bx 
SÈR 
BAe 
oak 
eeu 
pee 
pore’ 
*eUE. 
PEE 
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Py eee aa 
UD wea’ a EER” 
oe AO kims n “Een 
对 了 ， 有 “化 妆 品 次 "和 和 
“ERE HMEAES | 


首先 ， 试 着 画 成 -MRR ERLA D ERN KAD 


RAC! 
ERR 
30000 


那么 ， 我 们 试 着 未 
出 两 者 的 关联 "程度 
看 来 似 插花 较 多 钱 在 化 状 品 
上 的 人 也 会 花 较 多 的 钱 买 家 
服 有 1 
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指标 ”| 值 的 范围 计算 式 à Meg 








数值 数据 和 | 相关 系数 由 1 ~.1 zx 和) 的 共 变 别 数 > Sy 
数值 数据 VERE x yE V Sux x Syy 
数值 数据 和 组 间 变 异 

分 类 数据 | 相关 比 | o~ 级 内 变异 + AER 


一 参见 P121 “2 相关 比 ” 








分 类 数据 和 | R | gay OO 
分 类 数据 | 相关 系数 数据 个 数 x (min {交叉 资料 表 的 行 数 ， 交 又 资 料 表 的 列 数 )-1) 


~ 参见 P127 “3 SEM NER 





















随 着 数据 种 类 的 
不 同 ， 指 标 也 不 
AA! 






X 和 > 的 共 变 县 数 
AXE FR xy 的 变 县 数 TE 


Bn RRGKE 


1 个 月 的 “化 妆 品 费 ” 和 “ 置 装 费 ”之 相关 系数 计算 过 程 
化 装 品 








= =) = 
y7 | C- | OD 
A 小 姐 -8000 | 18490000 | 64000000 
B 小 姐 -7000 5290000 | 49000000 
C 小 姐 10000 | 22090000 | 100000000 
D 小 姐 -10000 | 28090000 | 100000000; 
E 小 姐 -3000 90000 | 9000000 
F 小 姐 15000 | 59290000| 225000000 
G 小 姐 -5000 5290000 | 25000000 
H 小 姐 0 1690000 0 
I 小 姐 5000 490000 | 25000000 
J 小 姐 3000 7290000 | 9000000 
合计 0 |148100000| 606000000 
l 
Sex Syy 






































1. 相关 系数 : Correlation Coefficient. 2. 共 变异 数 : Covariance。 3. 变异 数 : Variances 
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相关 系数 的 值 是 

0.9680 ! 
fe Vp) 
yh 
CQ 


而 且 ， 著 两 个 变量 的 相关 。 。 如 果 关联 性 越 弱 ， 相 关 _ 
性 越 强 ， 则 相关 系数 就 会 。 系数 则 会 越 接近 0。 由 于 这 个 结果 相当 接近 1， 所 以 


“Ret Sa Teo BR TE" HRR 
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如 同 本 次 ， 相 关系 数 的 值 若 为 正 


ü, w EHX: 反之 ， 
BHA, Maa AB. 


在 统计 学 上 ，" 若 其 值 在 XX 以 
上 则 可 说 两 个 变量 关联 性 较 强 ” 
的 基准 是 不 存在 的 。 


车 为 0， 则 称 为 
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相关 系数 值 之 意义 





相关 系数 的 绝对 值 
1.0~0.9 相关 性 非常 强 
09~07 相关 性 有 点 强 
07~05 相关 性 
相关 性 非常 弱 














MRE FRIES 
FAK AH 


之 前 说 过 ， 相 关系 数 为 表示 数值 数据 与 数值 数据 的 关联 性 
程度 的 指标 。 不 过 ， 严 格 说 来 并 非 如 此 。 相 关系 数 为 清楚 表示 
“数值 数据 与 数值 数据 之 间 是 否 具有 “直线 性 ”关联 的 指标 。 


不 适用 于 相关 系数 的 例子 

相关 系数 =-0.0825 | 如 同 左 图 所 示 ， 可 看 出 这 两 个 变量 
具有 了 明确 的 相关 性 。 然 而 ， 由 于 其 关联 
性 为 “曲线 ”的 状态 ， 因 此 相关 系数 的 
值 接近 于 0。 
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澳 2. 相 关 比 内 





Termes 
有 "年 龄 "和 喜欢 的 Chanellio 


服装 品牌 "的 问卷 调 pinay 


Burpurry 
Chanellio 
Termes 

Chanellio 
Termes 

Burpurry 
Burpurry 
Chanellio 
Termes 

Burpurry 
Chanellio 





Burpurry 


这 个 指标 也 是 越 接近 1， 
关联 性 越 强 吗 ? 








1. 相关 比 : Correlation Ratios 


“喜欢 的 服装 品牌 ”和 “年 龄 ” 














那么 ， 就 米 实 际 地 算 一 
下 相关 比 的 值 吧 ! 


A! ‘> 
WAR ERB | 
yj 


(NXT 
NA 


5 
jg. 





2) 
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进行 如 下 表 的 计算 。 


(23 一 26)=( 一 37=9 (25 一 29j 一 (一 人 一 16 (15—21)=(—6)=36 
(26—26) =0°=0 (26—29)=(—3)=9 (16—21}=(—5}=25 
(27-26"=1?=1 (29-29 =0°=0 (18—21}=(—3}=9 
(28—26}=2?=4 82—29} =3=9 22-21}=1}=1 

(33—29}=4=16 (26—21}=5=25 


(29-217 =8"=64 














160 


4 


Sos 





求 出 组 内 变异 ， 也 就 是 Sr + Sco + Sss 











Srrt+Scc +Sss=14+50+160=224 
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组 间 变 异 ， 也 就 是 求 出 : 


(Termes 的 数据 个 数 ) x ( Termes 的 平均 值 -整体 平均 值 ?+ ( Chanellio 的 
数据 个 数 x ( Chanellio 的 平均 值 - 全 体 平均 值 ?+ ( Burpurry 的 数据 个 数 ) x 
( Burpurry 的 平均 值 





4x (26-25)+5x (29-25 )=+6x (21-25? 
=4 x 1+5 x 16+6 x 16 
=4+80+96 
=180 











步骤 4 


end 级 间 变 异 
: 比 的 值 ， 求 出 一 一 一 二 一 0 
相关 比 的 值 ， 也 就 是 求 出 a ANER 
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Termes Chanellio Burpurry 


相关 比 的 值 为 1 <> 各 组 所 含 数 据 相同 <ES> 组 内 变异 为 0 














“喜欢 的 服装 品牌 ”和 “年 龄 ”的 散布 图 ( 相关 比 的 值 为 0) 。 














Termes Chanellio Burpurry 


ARKH <> 各 组 的 平均 值 相 辣 <ES> 组 间 
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相关 比 的 值 
100.8 œ 相关 性 非常 强 
08-05 ”一 “相关 性 有 点 强 
0.5-0.25 > HAHAAH 
未 满 0.25 “> ”相关 性 非常 弱 








那么 ， 由 于 本 次 的 结果 是 0.4455， 因 此 意思 是 “ 相 
关 性 有 点 弱 ”。 





B 3. 克 莱 姆 相关 系数 窜 


接 下 来 ， 如 果 有 可 以 说 明 关于 分 类 
数据 的 例子 就 好 了 。 


“咨询 300 位 高 中 生 | 
你 希望 对 方 用 什么 样 的 方式 向 你 
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话说 回来 ， 女 性 杂志 还 
真是 会 做 一 些 奇 妙 的 问 


“性 别 ” 和 “希望 的 表白 方式 ”的 交叉 资料 表 
硕 望 的 表白 方法 
HtA | 发 短信 | 当面 
34 bl | $3 

38 40 


4 
72 w1 | 127) | 


HBSTBAGHRBESS, Gravy TIWA. 








“性 出 ”和 “希望 的 表白 方式 ”的 交叉 资料 交行 交 
BMHRODE z 


合 


bs | 发 短信 | 当面 
| 36 100 


女性 23 41 
25 26 | #8 


%4 42 




















希望 当面 衣 白 的 男性 回答 者 ， 在 152 人 中 ， 占 
776/152 100=49 (%) 。 


on 
相 比 较 而 言 ， 女 生 比 较 硕 户 
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女生 和 男生 希望 的 摘自 话说 ，“ 性 别 "和 希望 的 
表白 方式 确实 有 一 表白 方式 "是 有 相关 的 。 


表示 分 类 数据 和 分 类 数 
据 之 间 相 关 程度 的 指标 


RIE ABORT AH 
“ 克 莱 姆 的 关联 系数 "、 
“FES KT RB 


1, 克 莱 姆 相关 系数 : Cramers Vo 


RR, RATS? 




















进行 下 表 的 计算 。 此 外 ， 粗 框 内 的 各 个 数值 ， 称 为 期 望 次 数 :。 


148x101 
300 


152x101 











1. 观测 次 数 : Observed Frequency 2. 期 望 次 数 : Expected Frequency。 
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三 72 . 101 j 127 
72+101+127 © 72+101+127 ”72 十 101 十 127 





72 : 101 : 127 


72 . 101 . 127 


”300 ”300 ` 300 


152x127 
300 





,| 《观测 次 数 一 期 望 次 数 》 yy 
py LE 4 
每 笔 数值 ENCA 来 计算 


希望 的 表白 方式 


发 短信 
148x101Y 
G- 


148x101 
300 


152x101 
2 
(6-5 
152x101 
300 
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求 出 步骤 3 的 表 中 粗 框 内 的 值 之 总 和 ， 意 即 皮尔 森 的 卡 方 统计 量 之 值 。 此 
外 ， 皮 和 尔 森 的 卡 方 统计 量 ， 以 下 用 “Xi ”表示 。 


148x72 7 101 148x127) 
+) 6-9 6) 


148x72 148x101 148x127 
300 300 


300 
(s- seny AG Es ison y G- 152x127 Ý 
300 300 


152x72 152x101 152x127 
300 300 300 





ae 











ra 











如 同步 骤 3 中 的 说 明 ， 观 测 次 数 和 期 望 次 数 的 差异 越 大 ， 
O 意 即 “ 性 别 ”和 “希望 的 表白 方式 ”之 间 的 关联 程度 越 强 ， 
| 则 皮尔 森 的 卡 方 统计 量 Xi 也 会 越 大 。 
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求 出 克 莱 姆 相关 系数 的 值 ， 即 








FA 
—_ (min[ 交 叉 资料 表 的 行 数 , 交叉 资料 表 的 列 数 } 一 1 ) 


此 外 ，min{a，b} 为 表示 a 和 b 中 较 小 的 值 之 记号 。 


/ 8.0091 =/ 8.0091 - (= Songai 
300x(min{2, 3}—1) 300x(2—1) 300 








因此 ， 克 莱 姆 相关 系数 的 值 
为 0.1634。 
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一 个 人 根本 没 办 法 计 
ER 








一 个 人 也 没 问 题 的 1 
计算 确实 很 繁琐 ， 但 如 果 
BARR, RTE 
出 来 的 。 




















如 果 还 有 不 懂 的 地 方 
来 问 我 就 可 以 了 吗 
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“性 别 ” 和 “希望 的 表白 方式 ”的 交叉 资料 表 
( 克 莱 姆 相关 系数 为 1 ) 








男性 f E Al 
克 莱 姆 相关 系数 的 值 为 ! C 女性 和 男性 的 喜好 完全 不 同 














“性 别 ” 和 “希望 的 表白 方式 ”的 交叉 资料 表 
( 克 莱 姆 相关 系数 为 0 ) 


希望 的 表白 方式 








FEHR AEN <> 女性 和 男性 的 喜好 完全 相同 














135 


“车 克 莱 姆 相关 系数 的 值 在 XX 以 上 ， 则 可 说 两 个 变量 的 关 
联 性 较 强 ”， 在 统计 学 上 并 不 存在 这 个 基准 。 请 参考 下 面 为 克 莱 
姆 相关 系数 的 值 之 意义 。 


克 莱 姆 相关 系数 的 值 之 意义 


克 莱 姆 相关 系数 的 值 若 细 分 …… 若 大 略 上 划分 
1.0~0.8 > 相关 性 非常 强 
08 ~0.5 相关 性 有 点 强 相关 
0.5 ~ 0.25 > 相关 性 有 点 弱 
未 满 025 相关 性 非常 弱 不 相关 











那么 ， 今 天 的 课程 


就 到 此 为 止 吧 | 
由 此 可 见 ， 我 们 举 的 例子 中 的 两 人 


变量 的 相关 性 非常 强 。 
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AK, REKAT ARH 
相关 系数 ， 而 下 一 次 会 利 
用 这 个 知识 点 学 习 “ 独 立 
pee, 





独立 性 检验 是 经 常用 于 分 A 只 是 学 会 它 ， 就 可 以 说 
析 问 卷 调查 结果 的 工具 。 1 你 已 经 掌握 了 统计 学 的 


所 以 下 次 是 最 后 一 堂 课 
了 吗 ? 

































































































































































































































































































































































1. 独立 性 检验 ;Test of Independence。 


137 





结果 如 下 表 所 示 。 








—= 


SERS S ARENAS 
RES | 





回答 者 2 ats 西式 料理 ws 咖啡 

















回答 者 250 | | 日 式 料理 | … 红茶 
用 上 表 做 成 的 交叉 资料 表 如 下 所 示 。 
a RE 
[4 红茶 


33 76 
53 104 
41 70 
























合计 ieee 127 250 
请 求 出 “在 家 庭 餐馆 常 点 的 料理 种 类 是 ? ”和 “ 若 附 免费 的 餐 后 饮料 ， 咖 
啡 和 红茶 哪 一 种 比较 好 ? ”的 克 莱 姆 相关 系数 值 。 








口 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
t 
1 
1 
1 
1 
1 A 
0 回答 者 1 ai 中 式 料理 = 咖啡 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
1 
. 
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Sin ALL IRB — Fh EAE? 





























求 出 期 望 次 数 。 



























咖啡 和 红茶 哪 一 种 比较 好 ? 计 
76x127 
T 76 
104x127 
5250 si 
70x127 
250 a 








127 
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计 简 由 (观测 次 数 一 期 望 次 数 
计算 出 各 个 表格 里 的 一 ，。 














] AEA es 










A 16x127 ) 
— 250 
16x127 
250 












76 

























eae _ 104x127) 
B ee) = m 


10x127 ` 
A 
~ wan 
250 






中 式 






70 
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步骤 4 
求 出 步 又 3 的 表 中 粗 框 内 的 值 之 总 和 ， 意 即 皮 尔 森 的 卡 方 统计 量 
Xi 之 值 。 
76123 16127 
@2 250 may 全 250 Jeary 
i=— an eet 2 
250 
104x123 104x127 
Gta) 250 ey ea) 250 ery 
— E 
10x123 10x127 
250 ea bce) 250 zy 
3 
250 250 
=3.3483 
步骤 5 


求 出 克 莱 姆 相关 系数 的 值 ， 即 








FH 
数据 个 数 x ( min{ 交 叉 资料 表 的 行 数 , 交叉 资料 表 的 列 数 } 一 1 ) 


3.3483 3.3483 3.3483 
; = = =0.1157 
250x(min{3, 2}—1) 250x(2—1) 250 
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“* 相关 系数 为 表示 数值 数据 和 数值 数据 的 关联 程度 之 指标 。 

+ 相关 比 为 表示 数值 数据 和 分 类 数据 的 关联 程度 之 指标 。 

© 克 莱 姆 相关 系数 ( 也 可 称 作 克 莱 姆 关联 系数 或 克 莱 姆 V ) 为 表示 分 
类 数据 和 分 类 数据 的 相关 程度 之 指标 。 

* 相 关系 数 、 相 关 比 和 克 莱 姆 相关 系数 的 特征 如 下 表 所 示 。 


克 妆 如 相关 系数 a 


“ 相关 系数 、 相 关 比 和 克 莱 姆 相关 系数 中 ， 在 统计 学 上 ， 并 无 “其 值 
若 在 XX 以 上 时 ， 则 两 变量 的 关联 性 较 强 ” 的 标准 。 
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se 


深入 理解 独立 性 检验 


























SOD ab, AR Rbk 
{ 提 过 的 新 校服 吗 ? 




















上 次 的 课程 中 ， 我 们 学 习 了 
克 莱 姆 相关 系数 ， 对 吧 ! 


那个 例子 的 克 莱 姆 相关 系数 值 
是 0.1634。 


那 份 问卷 调查 是 从 “居住 在 日 本 的 
全 体高 中 生 " 中 随机 抽样 的 结果 ， 


结论 是 一 一 "相关 性 非常 弱 "。 


只 不 过 是 300 人 的 资料 
所 得 的 推论 结果 





























如 果 再 抽样 调查 另外 的 
300A, 



























































克 菜 姆 相关 系数 的 什 
应 该 绝对 不 会 是 0.1634 
吧 ! 
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认为 原始 的 总 体 一 一 
“居住 在 日 本 的 全 体高 中 
生 " 的 克 莱 姆 相关 系数 是 
多 少 呢 ? 


没 错 。 如 果 没有 收集 到 "居住 
在 日 本 的 全 体高 中 生 "的 资料 
的 话 ， 


不 仅 限于 那个 例子 ， 一 般 而 
言 ， 我 们 是 不 可 能 知道 总 体 的 
克 莱 姆 相关 系数 的 值 。 
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对 于 总 体 的 克 “因为 从 随机 抽出 300 人 的 资料 所 以 总 体 的 克 莱 姆 相关 
中 ， 所 推论 的 克 莱 姆 相关 系数 系数 大 约 为 这 个 数值。 
为 0.1634， 


也 只 能 这 样 主观 地 判断 了 。 


不 过 利用 统计 学 ， 
或 许可 以 做 些 什么 
吧 ? 


A | 即使 运用 统计 学 ， 很 
可 异地， 我 们 还 是 无 法 严 
讶 地 得 知 克 莱 姆 相关 系数 





BR, RRL oe 
机 关系 数 的 值 一 arant T 









































ARS Reb | 只 要 使 用 之 前 提 过 的 
因为 可 以 得 到 客观 的 名 为 "独立 性 检验 "的 
总 体 信息 呀 | 分 析 方法 即 可 。 





首先 就 什么 是 "检验 ” 


独立 性 检验 是 统计 学 上 做 一 下 说 明 吧 | 


总 称 为 "检验 "的 分 析 方 
法 之 一 。 
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所 谓 的 “检验 ” 指 的 是 ， 从 所 设立 是 否 正确 的 分 析 
样本 的 资料 推测 分 析 者 对 于 方法 ! 


总 体 ， 





“检验 "这 个 名 词 ， 正 确 
说 来 ， 应 该 称 为 "统计 
的 假说 检验 "。 












































































“检验 ”的 实例 
可 使 用 的 情况 之 实例 

















推测 总 体 中 ，“ 性 别 ” 和 “和 希望 的 表白 方式 ”的 克 莱 姆 相关 系数 
之 值 是 否 为 0。 











推测 总 体 中 ， 
为 0。 





“喜欢 的 服装 品牌 ”和 “年 龄 ”的 相关 比 之 值 是 否 















推测 总 体 中 ，“1 个 月 使 用 的 化 妆 品 费用 ”和 “1 个 月 使 用 的 置 装 
费 ” 的 相关 系数 之 值 是 否 为 0， 











总 体 平均 数 差 检验 





推测 东京 都 的 女 高 中 生 和 大 阪 府 的 女 高 中 生 “ 每 月 的 零花 钱 ”是 


否 不 同 。 关注 意 这 个 例子 中 设 定 了 两 个 总体 

















总 体 比例 差 检验 | “ x x 内 阔 的 支持 率 ”是 否 不 同 。 wee, tmEnRE TOM 








推测 居住 于 都 市 的 有 投票 权 者 和 居住 于 农村 的 有 投票 权 者 中 ， 对 
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“检验 "的 种 类 虽然 有 
很 多 种 ， 但 分 析 的 程 
序 却 是 一 样 的 。 








建立 虚无 假说 ' 和 对 立 假说 * 

选择 要 进行 的 “检验 ”种 类 

决定 置信 水 平 ? 

从 样本 资料 求 出 检验 统计 量 的 值 。 

调查 【 步 又 5 】 所 求 出 的 检验 统计 量 值 ， 是 否 在 拒绝 域 *4 之 中 。 

若 【 步骤 6 】 的 检验 统计 量 在 拒绝 域 之 中 ， 则 结论 为 “对 立 假说 正 
确 ”。 反 之 ， 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 


























这 些 内 容 我 根 A \ 待 会 再 好 好 向 你 解说 。 
本 看 不 懂 ! 





1. RJ: Null Hypothesis。 2. : . Rejection Regiono 
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帘 2. 独 立 性 检验 窑 


那么 ， 现 在 开始 讲 今天 
的 主题 "独立 性 检验 "。 


RACH, ARM RIA 
表 中 的 两 变量 是 否 相关 的 分 析 
方法 。 


所 谓 的 "独立 性 检验 " 指 的 是 ， 推 测 "总 体 的 克 莱 姆 
相关 系数 的 值 完 竟 是 否 为 0 "的 分 析 方法 。 


原来 如 此 ， 那 就 是 问卷 
调查 分 析 啦 | 








解说 皮尔 森 卡 方 统计 量 必 和 卡 方 分 布 


_ 在 开始 解说 独立 性 检验 的 实例 前 ， 先 为 各 位 解说 独立 性 检 
区 虽然 现实 中 是 不 可 能 成 立 的 ， 但 我 们 假设 以 


总 体 “居住 在 日 本 的 全 体高 中 生 ” 中 随机 抽取 300 人 。 


© 


居住 在 日 本 的 全 体高 中 生 [300A | 





步骤 2 
对 步骤 1 中 抽出 的 300 人 进行 127 页 的 问卷 调查 ， 以 求 出 皮尔 森 卡 方 统计 量 xX。 


将 随机 抽出 的 300 人 送 回 总 体 。 


步骤 4 
持续 重复 步骤 1~ 3。 


如 此 一 来 ， 若 做 为 总 体 的 “居住 在 日 本 的 全 体高 中 生 ” 中 ， 其 克 莱 姆 相关 系数 
为 0， 则 实验 中 皮尔 森 卡 方 统计 量 8 之 图 形 为 自由 度 为 2 的 卡 方 分 布 :。 换 句 话说 ， 若 
做 为 总 体 的 “居住 在 日 本 的 全 体高 中 生 ” 中 ， 克 莱 姆 相关 系数 为 0%， 则 “实验 中 的 皮 
尔 森 卡 方 统计 量 ”服从 自由 度 为 2 的 卡 方 分 布 。 


1. 皮 尔 森 的 AL REx gal aa 
2. 自由 度 为 2 的 卡 方 分 布 ， 请 参照 
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试 着 进行 实际 实验 。 请 注意 ， 在 实验 进行 时 ， 我 
们 设 定 了 以 下 的 限制 条 件 。 


。 由 于 真正 以 “居住 在 日 本 的 全 体高 中 生 ” 为 对 象 的 实验 是 不 可 能 实现 的 ， 因 此 将 表 
7.1 中 记载 的 1 万 人 的 集合 ， 解 释 为 “居住 在 日 本 的 全 体高 中 生 ”。 

。 将 “居住 在 日 本 的 全 体高 中 生 ” 中 的 克 莱 姆 相关 系数 设 为 0。 意 即 ， 女 性 和 男性 在 
“ 想 在 电话 中 表白 : 想 在 短信 中 表白 : 想 当 面 表白 ”的 比例 是 相等 的 ( 请 参照 135 
页 ) 。 实 际 将 表 7.1 的 交叉 资料 表 做 成 表 7.2。 

。 由 于 实验 永 无 止境 ， 因 此 重复 步骤 1~ 3 的 步骤 20000 次 后 就 结束 。 


OR71 希望 的 表白 方式 ( 居住 在 日 本 的 全 体高 中 生 ) 
希望 的 表白 方式 
当面 
打 电 话 





发 短信 


OR72 “性 别 ” 和 “希望 的 表白 方式 ”之 交叉 资料 表 


发 短信 
1600 
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实验 结果 如 表 7.3。 图 7.1 是 以 表 7.3 为 基准 所 绘 出 的 直方 图 。 
OR73 实验 结果 











5.5 10.5 15.5 











多 图 7.1 ”以 表 7.3 为 基准 之 直方 图 ( 组 距 为 1 ) 
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“居住 在 日 本 的 全 体高 中 生 " 的 克 莱 姆 
相关 系数 的 值 为 0 


意 即 “性别 "和 "希望 的 表白 方式 "并 无 
关联 。 


那么 ， 从 “居住 在 日 本 的 全 体高 中 生 " 中 
选 出 300 人 进行 问卷 调查 


做 了 一 次 又 一 次 …… 又 一 次 上 






































cr za 


这 个 图 形 就 是 自由 度 为 2 时 的 卡 
BRHF | 





ej == 
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那么 ， 就 以 表白 方式 的 进行 独立 性 检验 吧 ! 
间 卷 调查 为 例 ， 


从 现在 起 ， 我 们 的 课程 就 以 
“WR 一 


分 成 "分 析 者 "和 "解说 
者 "来 说 明 ， 会 让 " 解 


BELLTER! 
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凉 凉 出 版 社 将 “询问 300 名 高 中 生 ! 你 希望 对 方 用 什么 样 的 方式 向 你 表白 ? ”的 
报道 刊载 于 女性 杂志 “P-girls” 中 。 凉 凉 出 版 社 从 “居住 在 日 本 的 全 体高 中 生 ” 中 ， 
随机 抽出 300 人 ， 进 行 了 问卷 调查 。 其 结果 如 下 表 所 示 。 


然后 ，“ 性 别 ” 和 “希望 的 表白 方式 ”之 交叉 资料 表 如 下 。 





打 电 话 。” 发 短信 


9 








总 体 “ 居 住 在 日 本 的 全 体高 中 生 ” 中 ，“ 性 别 ” 和 “希望 的 表白 方式 ”的 克 莱 姆 
相关 系数 的 值 是 否 大 于 0， 也 就 是 “性 别 ” 和 “希望 的 表白 方式 ”是 否 有 关联 ， 请 利 
用 独立 性 检验 来 推测 。 此 外 ， 我 们 将 置信 水 平 ( 待 后 说 明 ) 设 为 0.05。 
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CBS 


如 同 152~154 页 中 的 解说 ， 若 总 体 “居住 在 日 本 的 全 体高 中 
生 ” 中 的 克 莱 姆 相关 系数 为 0%， 则 “皮尔 森 卡 方 统计 量 局 ”是 服从 
自由 度 为 2 的 卡 方 分 布 。 因 此 ， 若 总 体 “ 居 住 在 日 本 的 全 体高 中 
生 ” 中 的 克 莱 姆 相关 系数 的 值 为 0， 则 由 随机 抽出 的 300 人 的 资料 所 = 
RHG EHS.INSA ERR, MUSA 103 BENE Dy e Y UU, 
楚 得 知 ， 其 值 为 0.05。 





t 
5.9915 
图 7.2 % 为 5.9915 以 上 的 机 率 


本 例题 的 X2 在 132 页 就 已 计算 完毕 ， 其 值 为 8.0091。 怎 么 会 这 样 呢 ? 虽然 是 由 随 
机 抽出 300 人 的 资料 所 求 出 的 值 ， 看 起 来 似乎 还 是 太 高 了 吧 ! 若 以 132 页 的 评论 为 基础 
来 思考 ， 总 体 “居住 在 日 本 的 全 体高 中 生 ” 的 克 莱 姆 相关 系数 的 值 大 于 0 的 想法 ， 是 
不 是 就 很 自然 呢 ? 

不 仅 限于 这 个 例题 ， 在 说 明 独 立 性 检验 时 ， 我 会 以 

四 暂且 解释 为 “总 体 的 克 莱 姆 相关 系数 的 值 为 0” 

@ 由 样本 的 资料 求 出 和 2 

图 若 丸 过 大 ， 则 结论 为 “总 体 的 克 莱 姆 相关 系数 的 值 大 于 0” 

这 样 的 流程 进行 说 明 ， 请 先 记 下 来 。 
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接 下 来 ,将 为 前 一 段落 的 @ 做 补充 。 
改 越 大 ， 则 下 图 斜 线 部 分 的 机 率 理应 越 小 。 


Oe 
È 


图 7.3 对应) 的 机 率 
独立 性 检验 中 ， 若 上 图 斜 线 部 分 的 机 率 在 名 为 置信 水 平 的 值 以 下 ， 则 可 做 “总 体 的 克 
莱 姆 相关 系数 的 值 大 于 0” 的 结论 。 置 信 水 平一 般 设 为 0.05 或 0.01， 采 用 何者 则 完全 取 
决 于 分 析 者 的 判断 。 


现在 假设 采用 0.05 的 置信 水 平 。 实 际 上 ， 所 谓 的 置信 水 平 就 是 指 下 图 斜 线 部 分 的 
机 率 。 


5.9915 


图 7.4 ”再 现 图 7.2 |=% 在 5.9915 以 上 的 机 率 ) 


此 外 ， 下 图 的 范围 称 为 拒绝 域 。 


5.9915 


图 7.5 (置信 水 平 0.05 时 ) 拒绝 域 
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由 于 本 例题 中 的 总 体 一 开始 就 定义 为 “居住 在 日 
本 的 全 体高 中 生 ”。 因 此 在 本 例题 中 ， 步 又 1 当然 是 
不 需要 的 。 

举例 来 说 ，149 页 的 表 “ 总 体 比例 差 检 验 ” 中 ， 
设 定 “ 居 住 在 都 市 的 有 选举 权 者 ”和 “居住 在 农村 的 
有 选举 权 者 ”为 总 体 。 那 么 ，“ 都 市 ”具体 上 到 底 指 


| BBR? “东京 都 和 大 阪 府 ” 吗 ? “各 都 道 府 县 的 地 


ARBRE” B? 这 是 由 分 析 者 所 决定 。 没 错 ， 实 
际 上 执行 “检验 ”时 ， 总 体 必须 由 分 析 者 自行 定义 。 

无 论 是 何 种 “检验 ”， 若 没有 清楚 地 定义 总 体 ， 
则 易 陷 于 “奇怪 ! 我 当初 到 底 想 推测 什么 ? ”的 状况 
之 中 。 陷 于 这 种 状况 的 分 析 者 并 不 在 少数 。 请 各 位 务 
必 特 别 注意 这 一 点 。 











步骤 2 
建立 虚无 假说 和 对 立 假说 。 
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选择 进行 的 “检验 ”种 类 。 
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从 样本 资料 求 出 检验 统计 量 的 值 。 


我 起 做 的 是 独立 性 检验 ， 因 此 检验 统计 量 为 皮尔 
琳 的 卡 方 统计 量 X6 。 本 例题 中 的 X3 值 已 在 132 页 计算 
384, Xo=8.0091. 


所 谓 的 检验 统计 量 ， 是 指 将 样本 资料 转换 成 1 个 值 的 
公式 。 


“ 汪 依 所 进行 “检验 ”的 种 类 不 同 ， 检 验 统计 量 也 会 有 


所 不 同 。 独立 性 检验 的 情况 ， 则 如 同上 述 ， 采 用 Xo， 而 
无 相关 检验 ( 请 参照 149 页 ) 的 情况 ， 则 采用 下 述 的 值 
“相关 系数 ?x EI 
V IHRE 
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调查 步骤 5 所 求 出 的 检验 统计 量 值 ， 是 否 在 拒绝 域 中 。 


检验 统计 量 - 皮 尔 森 卡 方 统计 量 的 值 为 
8.0091。 


由 于 置信 水 平 为 0.05， 因 此 ， 拒 绝 域 根据 103 页 
的 卡 方 分 布 表 得 知 ， 其 值 为 “5.9915 以 上 ”。 
如 下 图 所 示 ， 检 验 统计 量 的 值 在 拒绝 域 之 中 。 


拒绝 域 


5.9915 8.0091 


拒绝 域 依 置信 水 平 a 不同 而 变化 。 如 果 本 例题 中 人 
不 是 0.05 而 为 0.01 时 ， beige to Sat 
所 示 , 其 值 为 “9.2104 以 上 ”。 o 
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车 步骤 6 的 检验 统计 量 值 在 拒绝 域 之 中 ， 则 结论 为 “对 立 假说 正确 ”。 反 


Z, 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 
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Rit, RAPT 
yeas 检验 统计 量 的 值 如 果 不 在 


拒绝 域 中 ， 似 乎 可 说 " 诬 无 
假设 是 正确 的 " 呀 


举例 来 说 ， 请 假设 刚才 例题 的 
可 惜 的 是 ， 并 不 能 这 么 说 和 为 25013。 
只 能 说 "无 法 判定 虚无 假设 为 误 " 而 已 。 


0 2508 SS 


此 值 并 不 在 拒绝 域 
之 中 吧 ! 
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因此 ， 当 然 不 可 以 作出 "总 ee 然而 , 却 不 能 断言 "总 休 的 
体 的 克 菜 姆 相关 系数 的 值 i 克 菜 姆 相关 系数 为 0"。 


大 于 0 的 结论 。 


再 来 举 个 更 容易 
理解 的 例子 吧 ! 





嫌疑 犯 由 美 出 现 了 。 


























@) 
æ 

































































G 




























































































由 美 ， 
| A 
aaa i 以 这 个 假说 为 对 象 来 进行 
“检验 "。 

















Re pk] 
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假设 由 美 具有 非常 有 利 的 不 在 场 证 明 。 PRALRH, RLARWAM DK 


不 是 犯人 "的 结论 。 














那么 ， 假 设 由美 只 能 
举 出 令 人 怀疑 的 不 在 
场 证 明 。 


若 为 如 此 ， 则 当然 无 
法 做 出 "由 美 不 是 犯人 ” 


N 22 
Nome 


ra 


就 是 这 么 一 回 事 。 
然而 ， 也 不 能 因此 就 断 那么 就 继续 接 下 来 
定 “由 美 就 是 犯人 "。 








高 3. 虚 无 假说 和 对 立 假说 窜 








多 亏 了 你 ， 让 我 想起 冰冻 
里 还 有 布丁 。 









































F 





































































































N KARA, 






那么 ， 在 进行 检验 "时 ， 


话说 回来 ， 诬 无 假说 和 对 = = 
立 假说 是 什么 ? 其 实 ， 很 难 用 三 言 两 语 来 说 
= ARAM HA MIL 


刚才 你 说 等 一 下 要 说 明 ， 
但 我 还 没 听 到 ?了 
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Ta 


与 其 就 座 无 假 说 和 对 立 假说 是 什么 
作 说 明 ， 不 如 解释 怎样 的 假说 算是 
座 无 假说 和 对 立 假说 吧 1! 


“检验 ”的 实例 


可 使 用 的 情况 之 实例 








推测 总 体 中 ， “性别” 和 “和 硕 望 的 表白 方式 ”的 克 莱 姆 相关 系数 
独立 性 检验 | 之 什 是 否 为 0。 





推测 总 体 中 ，“ 喜 欢 的 服装 品牌 ”和 “年 龄 ”的 相关 比 之 值 是 否 
相关 比 检验 。 | 为 0。 





推测 总 体 中 ，“1 个 月 使 用 的 化 妆 品 费用 ”和 “1 个 月 使 用 的 置 装 
无 相关 检验 | 费 ”的 相关 系数 之 值 是 否 为 0。 





测 东 京都 的 女 高 中 生 和 大 阪 府 的 生 “ 每 月 的 零花 钱 ”是 
总 体 平均 数 差 检验 ela 高 中 生 和 大 版 府 的 女 高 中 生 “ 每 月 的 零花 钱 


MEE, RMN FRET RU 








推测 居住 于 都 市 的 有 投票 权 者 和 居住 于 农村 的 有 投票 权 者 中 ， 对 
总 体 比例 差 检验 | “x x 内 阁 的 支持 率 ” 是 否 不 同 。 


灶 注 意 ， 这 个 例子 中 设 定 了 两 个 总 休 


这 是 在 149 页 出 现 过 就 以 这 张 表格 的 
的 表格 。 例子 来 进行 说 明 
吧 ! 
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图 独立 性 检验 
| 
虚无 假说 | 总 体 中 “性 别 ” 和 “希望 的 表白 方式 ”之 克 莱 姆 相关 系数 的 值 为 0。 














对 立 假说 | 总 体 中 “性 别 ” 和 “希望 的 表白 方式 ”之 克 莱 姆 相关 系数 的 值 大 于 0。 


图 相关 比 检验 





总 体 中 “喜欢 的 服装 品牌 ”和 “年 龄 ”之 相关 比 的 值 为 0。 





总 体 中 “喜欢 的 服装 品牌 ”和 “年 龄 ”之 相关 比 的 值 大 于 0。 


图 无 相关 检验 
总 体 中 “1 个 月 使 用 的 化 妆 品 费 ” 和 “ 使 用 的 装置 费 ” 之 相关 系 
数 的 值 为 0。 








总 体 中 “1 个 月 使 用 的 化 妆 品 费 ” 和 “ 使 用 的 装置 费 ”之 相关 系 
数 的 值 不 为 0。 


get at ihe Sattar t 使 用 的 装置 费 ”之 相关 系 





总 体 中 “1 个 月 使 用 的 化 妆 品 费 ” 和“ 使 用 的 装置 费 ” 之 相关 系 
数 的 值 小 于 0。 
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图 总 体 平均 数 差 检验 





ou 


东京 都 的 女 高 中 生 和 大 孤 府 的 女 高 中 生 的 “每 个 月 零用 钱 ”相等 。 





东京 都 的 女 高 中 生 和 大 孤 府 的 女 高 中 生 的 “每 个 月 零用 钱 ” 不 相等 。 


或 


比 起 东京 都 的 女 高 中 生 ， 大 上 孤 府 的 女 高 中 生 的 “每 个 月 零用 钱 ” 较 
多 。 


或 


比 起 东京 都 的 女 高 中 生 ， 大 阪 府 的 女 高 中 生 的 “每 个 月 零用 钱 ” 较 
少 。 








国 总 体 比例 差 检验 





虚无 假说 


居住 在 都 市 的 有 投票 权 者 和 居住 在 农村 的 有 投票 权 者 中 ， 对 “XX 内 阁 
的 支持 率 ” 相 等 。 











居住 在 都 市 的 有 投票 权 者 和 居住 在 农村 的 有 投票 权 者 中 ， 对 “XX 内 阁 
的 支持 率 ” 不 相等 。 
或 
比 起 居住 在 都 市 的 有 投票 权 者 ， 居 住 在 农村 的 
有 投票 权 者 ， 对 “ x x 内阁 的 支持 率 ” 较 高 。 \ 
或 
比 起 居住 在 都 市 的 有 投票 权 者 ， 居 住 在 农村 的 


有 投票 权 者 ， 对 “ x x 内 阁 的 支持 率 ” 较 低 。 








173 


RARAP, ARRIE ZRH 

菜 既 相关 系数 的 值 越 接近 于 0"， 而 是 \a 

“SAP OREM ARH BO 

难以 证 明 的 假说 ， 你 明白 了 吗 ? ple alates 


因此 ， 虚 无 假说 就 是 "是 1” 看 来 难以 证 明 的 假说 
做 为 度 无 假说 ， 而 和 

“XX 为 相等 "的 肯定 假说 ; 虚无 假说 对 立 的 假说 
则 称 为 对 立 假说 。 


而 对 立 假说 则 为 "不 是 xx"xx 不 相等 ” 
的 否定 假说 。 


你 了 解 了 吗 ? 
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.P 值 和 “检验 ”的 顺序 客 





为 "检验 "下 结论 时 的 根 
BA 





@ 已 经 在 刚才 说 明 过 
7, MOMMA 
明 。 





依 " 检 验 "的 种 类 

不 同 ， 思 考 方式 

多 少 会 有 所 不 同 在 虚无 假说 为 真 的 情况 下 
则 本 次 求 出 的 值 为 大 于 或 等 


FX 值 的 机 素 。 
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原来 如 此 1 


在 电脑 普及 前 ， 要 算出 
P 值 可 是 相当 浩大 的 工 
AR | 


直到 20 世 纪 4o 年 代 初期 。 





现在 由 于 使 用 EXCEL 
就 可 求 出 P 值 ， 所 以 采 
用 外 的 情况 也 越 来 越 
£T 


























四 和 刚才 解说 过 的 
四 在 步骤 上 有 些 差异 …… 


176 #78 深入 理解 独立 性 检验 





EA 


| 调查 在 步 又 5 所 求 出 的 检验 统计 量 值 相对 应 的 P 值 ， 是 否 比 置信 水 平 小 。 


置信 水 平 为 0.05。 
由 于 检验 统计 量 的 皮尔 森 卡 方 统计 量 X 的 值 为 
8.0091， 因 此 P 值 为 0.0182。 
0.0182<0.05。 也 就 是 说 ，P 值 比较 小 。 


如 同 先前 所 述 ， 虽 然 依 “检验 ”种 类 不 同 ， 结 果 
也 会 不 同 ， 但 是 只 要 使 用 Excel， 仍 可 以 求 出 P 值 。 

值得 庆幸 的 是 ， 独 立 性 检验 的 P 值 可 经 由 Excel 来 
求 得 。 详 情 请 参照 208 页 。 
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步骤 7P 
在 步骤 6p 所 得 的 P 值 若 小 于 置信 水 平 ， 即 可 作出 “对 立 假说 为 正确 ”的 结 
论 。 反 之 ， 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 


P 值 小 于 置信 水 平 。 因 此 


总 体 的 克 莱 旭 相关 系数 的 信 大 于 0 , 
= HES" ARRAY AR 


这 样 的 对 立 假说 正确 ! 





即使 P 值 小 于 置信 水 平 ， 以 “检验 ”并 无 法 作出 “对 


OA? ste ast em Kat AMIEN “ANEN 
BUS 立 假说 “绝对 ， 正确， 但 是 ， 只 能 作 虚 无 假说 存在 正确 
的 机 率 为 (P 值 x 100)%” 的 结论 。 
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KRETA! 
琉 衣 ， 请 回 起 四 的 布 
例子 。 


即使 P 值 大 于 置信 水 平 ， 虽 看 似 
可 以 作出 "虚无 假说 为 正确 "的 结 
论 ， 但 实际 上 并 不 可 以 。 






























由 


i 
| 
È 






» 
Z) 
听 到 你 这 样 说 ， 我 也 很 
<| 
vV + 


, 
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什么 1 Dov de | ? 


a? 
0 Fo 
E | 























到 底 是 为 了 什么 才 那 么 拼命 

地 学 统计 学 呀 ? 有 ? 
难道 你 不 是 真 
的 对 统计 学 感 
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KAERRA S 
知识 吧 | 

















































































































咱们 两 个 人 的 课程 还 会 继续 …… 
REB? 
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内 5. 独立 性 检验 和 齐 性 检验 灾 





齐 性 检验 ( test of homogeneity ) 与 独立 性 检验 是 非常 类 似 的 “检验 ”方法 。 
齐 性 检验 的 例子 如 下 所 示 。 请 一 边 阅 读 ， 一 边 思考 和 独立 性 检验 的 差异 。 





“询问 300 名 高 中 生 ! 你 希望 对 方 用 什么 样 的 方式 向 你 表白 ?” 
* 打 电话 
。 发 短信 
* 当 面 
的 报道 ， 凉 六 出 版 社 刊载 在 女性 杂志 “P-girls” 之 中 ， 然 而 凉 六 出 版 社 早 已 设立 
下 列 假说 。 


| 打 电话 : 发 短信 : 当面 
的 人 数 比 ， 女 高 中 生 和 男 高 中 生 有 所 不 同 。 





因此 ， 为 了 确定 上 述 的 假说 是 否 正确 。 凉 凉 出 版 社 从 “居住 在 日 本 的 全 体 女 高 
中 生 ” 和 “居住 在 日 本 的 全 体 男 高 中 生 ” 中 ， 各 随机 抽出 一 些 人 进行 实际 的 问卷 调 
查 。 其 结果 如 下 表 。 














希望 的 告白 方法 | 年龄 | am 

回答 者 1 当面 17 女 
回答 者 148 | ”发 短信 16 男 
回答 者 149 打 电 话 15 x 
回答 者 300 发 短信 18 男 
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然后 “性 别 ”和 “希望 的 表白 方式 ”的 交叉 资料 表 如 下 。 














© 


假设 “居住 在 日 本 的 全 体 女 高 中 生 ” 和 “居住 在 
日 本 的 全 体 男 高 中 生 ” 为 总 体 。 











EEH 
** 打 电话 :发 短信 : 当面 ， 的 比例 ， 两 者 相 
建立 虚无 假 说 和 对 立 假 | 等 ”。 
3 对 立 假说 为 
ce TO E AEN E I IOC, MAAM 
RET RR” iiaee, 
决定 置信 水 平 假设 置信 水 平 为 005。 








从 样本 资料 求 出 检验 统 
计量 的 值 。 


本 例题 中 欲 进行 的 是 齐 性 检验 。 因 此 检验 统计 量 
为 皮尔 森 卡 方 统计 量 X 。 本 例题 中 的 Xs 值 已 在 
132 页 计算 完毕 。%*% =8.0091。 且 本 例题 中 ， 若 虚 


无 假说 为 真 ， 则 皮尔 森 统计 量 X 为 服从 自由 度 
(2-1) x (3-1) =1x2=2 的 卡 方 分 布 。 








| 调查 在 步骤 5 所 求 出 的 检 
j 验 统计 量 值 ， 是 否 在 拒 


检验 统计 量 Xe 的 值 为 8.0091。 由 于 置信 水 平 a 为 
0.05， 因 此 根据 103 页 的 卡 方 分 布 表 ， 拒 绝 域 为 
“5.9915” 以 上 。 检 验 统计 量 的 值 在 拒绝 域 之 











检验 统计 量 的 值 在 拒绝 域 之 中 。 因 此 对 立 假说 为 
““ 打 电话 : 发 短信 : 当面 ”的 比例 ， 两 者 不 相 
等 ”为 正确 。 
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如 何 ? 例题 和 解答 都 和 独立 性 检验 的 例子 几乎 相同 。 

下 面 我 们 来 确认 独立 性 检验 和 齐 性 检验 的 相 异 之 处 。 

相 异 处 有 3 点 。 首 先 ， 定 义 的 总 体 不 同 。 前 者 是 “居住 在 日 本 的 全 体高 中 生 ” 的 
一 群 总 体 ， 后 者 则 是 “居住 在 日 本 的 全 体 女 高 中 生 ” 和 “居住 在 日 本 的 全 体 男 高 中 
生 ” 的 两 类 总 体 。 此 外 ， 假 说 也 不 相同 。 前 者 是 


总 体 的 克 莱 姆 相关 系数 的 值 为 0 
=“ 性 别 ” 和 “希望 的 表白 方式 ”不 相关 。 





总 体 的 克 莱 姆 相关 系数 的 值 大 于 0 
=“ 性 别 ” 和 “希望 的 表白 方式 ”相关 。 





而 后 者 是 


虚无 假说 | ( 打 电话 : 发 短信 : 当面 ) 的 比例 ， 两 者 等 。 
( 打 电 话 发 短信 : 当面 ) 的 比例 ， 两 者 不 相 





对 立 假说 
等 。 
另外 ,顺序 也 不 太一 样 。 前 者 是 收集 资料 后 才 建 立 假说 ， 而 后 者 是 在 收集 资料 
前 就 先 建立 假说 。 


如 同 前 段 所 说 明 的 ， 独 立 性 检验 和 齐 性 检验 有 明确 的 相 异 点 。 然 而 ， 实 际 上 
通常 的 情况 是 ， 本 来 想 做 独立 性 检验 ， 却 误 做 了 齐 性 检验 ， 或 是 想 要 两 种 都 做 做 看 
之 所 以 想 进行 独立 性 检验 ， 通 常 是 因为 已 经 进行 了 齐 性 检验 ， 或 是 想 进行 齐 性 检验 
时 ， 通 常 是 因为 已 经 进行 了 独立 性 检验 。 因 此 ， 请 特别 注意 。 
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央 6.“ 检 验 ”的 结论 表现 实 





到 目前 为 止 “检验 ”中 的 结论 都 是 以 


若 检验 统计 量 的 值 在 拒绝 域 之 中 ， 则 做 出 “对 立 假说 为 正确 ”的 结论 。 反 之 ， 则 





“无 法 判定 虚无 假说 为 误 ” 的 结论 。 


EE pa 
来 表现 。 但 实际 上 ， 这 样 的 表现 方式 并 非 一 般 性 的 。 
“检验 ”的 结论 的 表现 形式 有 很 多 种 ， 兹 总 整理 于 下 表 。 


9 表 7.4 “检验 ”的 结论 表现 





9 值 在 拒 
确 。 





对 立 | -无 法 判定 虚无 假说 为 误 。 








“有 信心 。 "无 信心 。 
“放弃 虚无 假说 。 ,无 法 放弃 虚无 假说 。 
“保留 虚无 假说 
* 无 法 判定 虚无 假说 为 不 真 。 


.采纳 虚无 假说 。 


“有 信心 ”“ 无 信心 ”的 表现 不 是 比较 易于 使 用 吗 ? 那么 ， 为 什么 我 要 故意 使 
用 非 一 般 性 的 表现 ? 真正 的 理由 如 下 所 述 。 

我 想 恐 怕 只 是 想 确认 检验 统计 量 的 值 和 P 值 的 大 小 吧 ! 我 已 经 注意 到 ， 学 习 “ 检 
验 ” 的 人 之 中 ， 有 些 人 在 完全 不 了 解 用 途 的 状况 下 ， 就 轻易 地 将 “有 信心 ”时 常 挂 
在 嘴 边 。 这 些 人 完全 不 了 解 “ 有 信心 ”的 意义 ， 事 实 上 他 们 是 在 未 确立 虚无 假说 和 
对 立 假说 之 下 ， 就 直接 进行 “检验 ”。 我 认为 这 些 人 根本 不 明白 总 体 的 定义 。 以 前 
我 也 曾 想 过 : 对 于 才刚 开始 学 统计 学 的 人 再 怎么 吹 毛 求 疫 也 没 用 。 然 而 ， 若 对 虚无 
假说 和 对 立 假说 的 意义 不 明了 ， 又 怎么 下 结论 ? RR, KERMAT ERATE 
要 求 。 因 此 ， 本 书 为 了 让 虚无 假说 和 对 立 假说 可 以 永存 于 读者 脑海 中 ,特别 使 用 了 
“对 立 假说 为 正确 ”和 “无 法 判定 虚无 假说 为 误 ”的 表现 方式 进行 处 理 。 
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例题 






下 表 为 沿用 前 一 章 138 页 的 交叉 资料 表 。 





Diner men 














合计 
eee 
日 式 料理 | 43 33 76 
KARD Tce si 33 104 











请 用 独立 性 检验 推 澳 


Ba 中 式 料理 | 29 41 70 
Bi 123 127 250 


| 总体 为 “居住 在 日 本 20 岁 以 上 的 人 ”之 中 ，“ 常 点 的 料理 种 





类 ”和 “咖啡 和 红茶 哪 一 科 

















设 “ 居 住 在 日 本 20 岁 以 上 的 人 ”为 总 体 。 





建立 虚无 假说 和 | 
说 。 


对 立 假 


虚无 假说 为 “常食 用 的 料理 种 类 ”和 “咖啡 
和 红茶 哪 一 种 比较 好 ?” 有 相关 。 
对 立 假说 为 “常食 用 的 料理 种 类 ”和 “咖啡 
和 红茶 哪 一 种 比较 好 ?” 不 相关 。 





选择 要 进行 “ 检 


验 ”的 


进行 独立 性 检验 。 





决定 置信 水 平 。 


设置 信 水 平 为 0.01。 





计量 的 值 。 


从 样本 资料 求 出 检验 统 


本 例题 欲 进行 的 是 独立 性 检验 。 因 此 检验 统 
计量 为 皮尔 森 卡 方 统计 量 X 。 本 例题 中 的 
双 值 已 在 141 页 计算 完毕 。% =3.3483。 





验 统计 量 的 值 ， 
拒绝 域 之 中 。 


调查 步骤 5 所 求 出 的 检 


是 否 在 


检验 统计 量 Xe 的 值 为 3.3483。 由 于 置信 水 平 
a 为 0.01， 因 此 根据 103 页 的 卡 方 分 布 表 ， 
拒绝 域 为 “9.2104” 以 上 。 检 验 统计 量 的 值 
不 在 拒绝 域 之 中 。 





步骤 7 


若 步 又 6 的 检验 统计 量 
在 拒绝 域 之 中 ， 则 结论 
为 “对 立 假说 正确 ”。 
反之 ， 则 结论 为 “无 法 
判定 虚无 假说 为 误 ”。 
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检验 统计 量 的 值 不 在 拒绝 域 之 中 。 因 此 无 法 
判定 虚无 假说 一 一 “ 常 点 的 料理 种 类 ”和 
“咖啡 和 红茶 哪 一 种 比较 好 ?” 两 者 有 相关 
为 误 。 





。 所谓 “检验 ” 指 的 是 ， 由 样本 数据 来 推测 分 析 者 针对 总 体 所 建立 的 假 
说 是 否 正确 的 分 析 方 法 。 
。“ 检 验 ”的 正确 名 称 为 统计 的 假说 检验 。 
+ 检验 统计 量 是 将 样本 数据 转换 为 1 个 数值 的 公式 。 
。 置 信 水 平一 般 都 设 为 0.05 或 0.01。 
。 拒 绝 域 为 对 应 置信 水 平 的 范围 。 
。 独 立 性 检验 为 推测 “总 体 的 克 莱 姆 相关 系数 的 值 是 否 为 0” 的 分 析 方 
法 。 也 可 说 是 推测 “交叉 资料 表 中 的 两 变量 是 否 有 关联 ”的 分 析 方法 。 
。 若 总 体 的 克 莱 姆 相关 系数 的 值 为 0， 则 “皮尔 森 卡 方 统计 量 X2 ”为 遵守 
卡 方 分 布 。 
。 虚 无 假说 若 为 真 ， 独 立 性 检验 中 的 P 值 ， 为 求 出 大 于 或 等 于 本 次 所 求 出 
的 皮尔 森 卡 方 统计 量 X ?之 机 率 。 
。 在 “检验 ”中 ， 下 结论 的 根据 有 2 种 : 
O 检验 统计 量 的 值 是 否 在 拒绝 域 中 。 
@ P 值 是 否 小 于 置信 水 平 。 
。 无论 是 否 为 独立 性 检验 ， 其 “检验 ”分 析 顺序 均 相 同 。 具 体 来 说 ， 如 
下 所 述 。 
mi] 定义 总 体 。 
站 对 | 建立 虚无 假说 和 对 立 假说 。 
BRI 选择 要 进行 的 “检验 ”种 类 。 
| 决定 置信 水 平 。 
从 样本 数据 求 出 检验 统计 量 的 值 。 
调查 在 步 又 5 所 求 出 的 检验 统计 量 值 ， 是 否 在 拒绝 域 之 中 。 
车 在 步骤 6 中 检验 统计 量 的 值 在 拒绝 域 之 中 ， 则 结论 为 “对 立 假说 
成 立 ”。 若 非 如 此 ， 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 
调查 与 在 步 又 $ 所 求 出 的 检验 统计 量 值 相对 应 的 P 值 ， 是 否 比 置信 
水 平 小 。 
步骤 6P 所 得 的 P 值 若 小 于 置信 水 平 ， 则 可 作出 “对 立 假说 正确 ”。 





























| 反之， 则 结论 为 “无 法 判定 虚无 假说 为 误 ”。 
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om Re 
运用 EXCEL 计算 























在 此 ， 利 用 Excel 函 数 功能 进行 解说 。 
1. 做 成 次 数 分 布 表 (的 一 部 分 ) 
2. 算 出 平均 数 、 中 位 数 、 标 准 差 
3. 做 成 “次 数 分 布 表 ”( 的 一 部 分 ) 
4. 算 出 标准 分 数 、 离 差 
5. 算 出 标准 正 态 分 布 的 机 率 
6. 算 出 卡 方 分 布 的 横 轴 刻度 
7. 算 出 相关 系数 的 值 
8. 独立 性 检验 
已 经 熟悉 Excel 函 数 功能 的 读者 ， 建 议 你 先 从 “2 算出 平均 数 、 中 位 数 、 标 准 差 "人 


国 做 成 次 数 分 布 表 (一 部 分 ) 


使 用 33 页 的 资料 
选取 "J3" 单 元 格 。 
Me IC] 
amtii Too Attas 7 AL RA CF) AR 
Amm so Aitz S9. S00 600.599 
Aans w Ama Eso 600, 700. 699 
‘An sso amaze SBO 700. $00. 199, 
拉面 人 5 so SRS TS 800 900i 899 
Bats. Tso. Amn o 00 1000, 999 
samt so Amt so 
Amta 90 HESS To 
hmt 20 mR mo. 
Aatto To MRS w 
Aat m pans m 
拉面 二 12 To mes w 
pmts eo Rms 80, 
patis so am» 190 
nms To Reo 199, 
Hits so Ama ‘9, 
Amm em Amis 600, 
ci m mass 619, 
Bms sm mines 80, 
amao T20 Amtes 50, 
pana s0 Atte so 
Batz) mo Aa 30 
patz To Bites 50, 
Amta so Rms m. 
Batz To pms 00 
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从 工具 栏 的 “ 插 人 人 ”中选 “函数 ”一 项 。 
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选取 下 图 所 示 的 范围 ， 点 “确定 ”按钮 。 








680, 00, 
wo so 
so e 
Tw o 
so a 
To. $0. 
799, eso 
so m 
180 100 


从 单元 格 J3 为 起 点 ， 如 同 下 图 ， 选 取 单 元 格 -J3 到 `J7 的 范围。 
Ean amasa 
AL AP) 次 数 
500, 600... $99.4 
600,100 699 
Too emo. 199 
00,900.99 
$00, i000 98, 


点 数学 式 中 的 这 个 部 分 。 





同时 按 下 “Shift” 键 和 “Ctrl” 键 后 ， 按 “Enter” 键 。 
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Fe Ss ae fae a 
以 上 未 满 OAT) 次数 
500 600 599 4 
600 700; 699 13 
700. 800. 799, 18 
B00. 900. 899 12 
900 1000 999 3 


加 算出 平均 数 、 中 位 数 、 标 准 差 


选取 单元 格 "B10"。 





从 工具 栏 的 "插入 "中 选取 "函数 "一 项 。 


Seo ce 
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在 "选取 类 别 " 中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "AVERAGE"。 





选取 下 图 的 范围 ， 点 击 "确定 "按钮 。 





计算 完成 ! | 
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与 【步骤 1】 到 【步骤 5】 相同 步 又， 求 中 位 数 和 标准 差 。 求 中 位 数 时 ， 利 用 
“MEDIAN 函数 ， 求 标准 差 时 ， 则 利用 "STDEVP" 函 数 。 


做 成 “次 数 分 布 表 ”一 部 分 ) 
使 用 61 页 的 资料 。 


选取 单元 格 "F20"。 







oe 
bt 
seeseusese 


SHINNSUNSY 


从 工具 栏 的 “插入 ”中 选取 “函数 ”一 项 。 


在 "选取 类 别 "中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "COUNTIF 。 
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选取 下 图 的 范围 ， 在 "Crjteria "直接 输入 "喜欢 "， 点 "确定 "按钮 。 













seesvusens 





EJ 
a 
2 
z 
a ta 
x 5 
u sg. æ ak 
12 要 次 n aR 
13 ta 2 ak 
14 aK 2 Ek 
15 aK 30 aK 
次 数 
要 区 2 
a 
HR 


与 【 步 又 1】 到 【步骤 5】 相 同步 又 ， 求 "普通 -和 "讨厌 "的 次 数 。 
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D 算出 标准 分 数 、 高 差 
使 用 72 页 的 资料 。 


从 【步骤 1】 到 【步骤 5】 是 标准 分 数 的 相关 程序 。 而 从 【步骤 10】 到 【步骤 
12) 为 离 差 的 相关 程序 。 

虽然 Excel 中 存在 可 求 出 标准 分 数 的 函数 ， 然 而 并 不 存在 可 求 出 离 差 的 函数 。 但 
是 ， 如 果 利用 标准 计 分 的 结果 ， 将 能 更 快 求 出 离 差 。 因 此 ， 本 书 使 用 Excel 求 离 差 。 


选取 单元 格 "E2"。 





从 工具 栏 的 "插入 "中 选取 “函数 "一 项 。 


在 "选取 类 别 " 中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "STANDARDIZE"。 
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选取 单元 格 "B2"。 





于 *Mean" 中 选择 单元 格 "B20" 后 ， 按 一 次 *F4" 键 ， 并 确认 *B20" 是 否 变 成 
“$B$20"。 
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于 “Standard_dev" 中 选取 "B21" 后 ， 按 一 次 "F4" 键 ， 并 确认 “B21" 是 否 变 成 "$B$21" 
后 ， 点 “确定 "按钮 。 





确认 是 否 已 求 出 琉 衣 的 标准 分 数 。 









AR 

A 

< 

中 2 

>. t 

si F 

5 6 

pi X 

53. a 

100, T 

st. x 

s L 

s a 

a K 

-如 o 

To; 2 
53, 
ar 
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To 


将 鼠标 移 近 单元 格 *E2" 的 右 下 角 ， 待 鼠标 变 为 "黑色 十 字 游 标 "后 ， 按 下 鼠标 左 
键 ， 拖 拉 至 "E19" 后 放 开 左 键 。 


: 


EE 
a 


标准 差 计算 完成 ! ! 
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Bo 


选取 "F2"， 在 单元 格 内 输入 *=E2*10+50"， 然 后 按 下 “Enter" 键 。 





重复 【步骤 8】 的 操作 。 


Be 


离 差 计算 完成 ! ! 
oR Ae 
ae em 
aR ass 
A Ln ny 
è ase 
€ io 2 
5 io as 
i ar s 
t as 38 
6 aro as 
i 2a m 
I ° 0 
1 im w 
i ass 
上 as s 
1 as 0 
x ano ae 
9 “ot 3 
è as Bs 
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算出 标准 正 态 分 布 的 机 率 
使 用 93 页 的 资料 。 


选取 单元 格 "B2"。 


从 工具 栏 的 "插入 "中 选 "函数 "一 项 。 


在 "选取 类 别 " 中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "NORMSDIST 。 


选取 单元 格 "B1"， 按 下 "确定 " 键 。 
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其 实 “NORMSDIST” 为 求 出 下 图 机 率 的 函数 。 
在 此 ， 于 单元 格 “B3” 内 输入 “=B2-0.5”。 


z 1.96 
中 途经 过 0.975002 
BR (HARME) =82-0.5 









计算 完成 ! ! 
z 1.96 
中 途经 过 0.975002 
面积 《= 比 便 -机 率 ) 0. 475002 
算出 卡 方 分 布 的 横 轴 刻 度 
使 用 104 页 的 资料 。 
选取 单元 格 "B3"。 


从 工具 栏 的 "插入 "中 选 "函数 "一 项 。 


在 "选取 类 别 "中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "CHIINV 。 
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选取 单元 格 "B1" 和 单元 格 "B2"， 按 下 "确定 " 键 。 





计算 完成 ! 


A HE 0.05 
1 
RAR 3.845459 
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算出 相关 系数 的 值 
使 用 116 页 的 资料 。 


选取 单元 格 "B14"。 








从 工具 栏 的 “插入 "中 选 “函数 一 项 。 


在 "选取 类 别 " 中 选择 "统计 "， 再 从 "选取 函数 "中 选择 "CORREL 。 


选取 下 图 的 范围 后 ， 按 下 "确定 " 键 。 





207 


计算 完成 ! ! 


| 
ae 





独立 性 检验 
使 用 157 的 资料 。 


选取 单元 格 "B8"。 


[mes | se | 当面 | 合计 | 
Laaf ie | 
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于 单元 格 "B8" 内 ， 输 入 “=E2*B4/E4"。 然 后 按 下 "Enter 键 。 
ame a de = e 
B a 
En kant ai 


选取 单元 格 "B8" 内 的 "E2" 文 字 部 分 ， 连 按 3 次 "F4" 键 ， 并 确认 *E2" 是 否 变 为 "SE2” 
后 ， 按 下 "Enter 键 。 





选取 单元 格 *B8" 内 的 *B4" 文 字 部 分 ， 连 按 2 次 *F4" 键 。 并 确认 *B4" 是 否 变 为 
“BS$4"。 选 取 单元 格 "B8" 内 的 "E4" 文 字 部 分 ， 按 1 次 "F4" 键 ， 确 认 "E4" 是 否 变 为 "$SE$4” 
后 ， 按 下 "Enter 键 。 
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选取 单元 格 "B8"， 将 鼠标 移 近 单元 格 "B8" 的 右 下 角 ， 待 鼠标 变 为 "黑色 十 字 鼠 标 " 
后 ， 按 下 鼠标 左 键 ， 拖 来 至 "D8" 后 放 开 左 键 。 




















从 单元 格 "B8" 选 取 单 元 格 "D8"， 将 鼠标 移 近 单元 格 "D8" 的 右 下 角 ， 待 鼠标 变 为 
"黑色 十 字 鼠 标 "后 ， 按 下 鼠标 左 键 ， 拖 拉 至 单元 格 "D9" 后 放 开 左 键 。 





| 
Co 


[zi | EN 





选取 单元 格 *B12"。 从 工具 列 的 "插入 "中 点 选 "函数 "。 在 "选取 类 别 " 中 选择 " 统 
计 "， 再 从 "选取 函数 "中 选择 "CHITEST"。 
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选取 下 图 的 范围 ， 按 下 “确定 "按钮 。 
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用 漫画 这 种 形式 讲 数学 、 物 理 和 统计 学 ， 十 分 有 利于 在 广大 青少年 中 普及 科学 知识 。 


MAR MARAE, MRA MARC EAN oa 
中 目 友 好 协会 理事 ， (RERE 顾问 ， 全 国政 协 原 副 秘 书 长 


用 漫画 和 说 故事 的 形式 讲 数学 ， 使 面貌 冷峻 的 数学 变 得 亲切 、 生 动 、 有 趣 ， 使 学 习 数 学 变 得 容 
易 ， 这 对 于 提高 全 民 的 数学 水 平 无 疑 是 功德 无 量 的 事 。 


《数理 天 地 》 HEE 社 长 总 编 
“HL SOKFRHROSS GME RTE Ry 国 i 


数学 < 物理 知识 ， 更 能 让 大 家 感受 到 数学 殿堂 的 奥妙 与 乐趣 。 


《光明 日 报 》 原 副 总 编辑 aa 
申 华 炎 黄 文化 研究 会 常务 副 会 长 % 


象 思维 的 方式 掌握 自然 科学 的 金 钥匙。 


申 国人 民 大 学 外 语 学 院 日 语 专业 主任 
大 学 日 语 教学 研究 会 全 长 À 同 社 


于 每 次 都 能 看 到 很 多 年 轻 的 白领 看 这 套图 书 ， 经 济 实惠 、 图 文 
也 一 定 会 成 为 白领 们 的 手中 爱 物 。 


大 连理 工大 学 RASANEN 博士 副教授 4 O 


用 漫画 的 形式 ， 讲 解 日 党 













物 形象 、 有 卡通 图 、 有 故事 情节 ， 当 然 最 重要 的 还 有 
孩子 们 的 学 习 兴趣 ， 降 低 他 们 对 于 高 深 的 理工 科 知 识 


北京 启明 显 培训 学 术 RE pete 
生活 ， 概 念 更 容易 理解 。 
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